机器学习与AI生成创作-CSDN博客

转载 Gemini 3与Nano Banana实战！全网第一本书重磅上市！

由此可见，不管是商业还是教育领域，生成式AI都在重塑编程行业的底层逻辑与价值格局——在AI与人类协同的新范式下，编程的价值不再依附于代码行数，而在于解决问题的效率与创造力。对于零编程基础的读者，本书提供了从0到1的系统学习路径，搭配简单易懂的知识点与实操案例，助你快速掌握AI编程的核心方法。凭借扎实的理论基础、详细的工具解析、丰富的实战案例、完整的上线流程，为你构建了一套适应AI时代的思维方式与行动框架。编程的核心正在从“写代码”转向“定义需求”，文档撰写、逻辑表达等元能力的重要性，已远超具体的语法知识。

2026-01-28 21:00:53 35

转载建议所有博士都去学一遍，赢麻了！！！

对科研经验比较薄弱的学生来说，即使发过低区位SCI/CCF论文，学会了缝合大法，想独立发表第一篇高区位文章也是非常有难度的。它能让你像“搭积木”一样，将已有的研究成果进行巧妙组合与优化，即使是科研新手，也能快速完成一篇顶会顶刊水平的论文！让你明白：你发不出顶会顶刊，不是因为你不够聪明、不够努力，而是因为你还没有掌握真正高效的思维和方法！因此，对于着急发文章的人或者自身学习能力比较差的人，有一位科研经验丰富的导师手把手指导就非常有必要。新手搞科研，发不出顶会顶刊，不是因为你不够努力，而是因为你仍在沿用那套。

2026-01-16 10:02:30 34

转载＜span class=“js_title_inner“＞建议所有博士都去学一遍，赢麻了！！！＜/span＞

对科研经验比较薄弱的学生来说，即使发过低区位SCI/CCF论文，学会了缝合大法，想独立发表第一篇高区位文章也是非常有难度的。它能让你像“搭积木”一样，将已有的研究成果进行巧妙组合与优化，即使是科研新手，也能快速完成一篇顶会顶刊水平的论文！让你明白：你发不出顶会顶刊，不是因为你不够聪明、不够努力，而是因为你还没有掌握真正高效的思维和方法！因此，对于着急发文章的人或者自身学习能力比较差的人，有一位科研经验丰富的导师手把手指导就非常有必要。新手搞科研，发不出顶会顶刊，不是因为你不够努力，而是因为你仍在沿用那套。

2026-01-16 10:02:30 23

转载《动手学大模型智能体》！上海交大俞勇团队“动手学”系列第6本重磅新作上市！

本书将数据结构的理论与真实应用的实践紧密结合，从各种数据结构的代码实现到火车票管理系统的代码实现，手把手地指导读者学习数据结构与算法，帮助读者轻松掌握数据结构与算法的基本知识及基本技能，为后续进行更多专业课程的学习打下扎实基础。，从“构建第一个智能体”，到“构建文档问答智能体”“构建多功能智能体”，再到“构建基于大模型的多智能体”“基于MCP的智能体助手”，多个递进式实战项目，让读者边学边练，积累可复用的工程经验。遵循“先搭框架、再攻核心、实战巩固、前沿拓展”的思路，能让你高效掌握大模型智能体的核心技能。

2026-01-08 21:06:37 93

转载 40年翘首，C++之父编程经典重磅上新！

除了全面性，实战导向是本书的另一大亮点。”事实上，许多标准条款的原始思路就源自他的文本，这本书更像是标准的“思想注解”，能帮开发者跨越标准文档的专业壁垒，直达技术核心。从DOS时代到AI浪潮，从C++11到C++20，这门语言已渗透全球数千万开发者的工作台 ——Windows 系统、AI 芯片、航天软件、金融风控、3A 游戏引擎，数字时代的核心领域几乎都离不开它的支撑。本书作者Bjarne，不仅是C++语言的设计者与最初实现者，更是ISO C++标准的核心推动者，他的每一个观点都源自语言诞生的源头。

2025-12-31 20:56:14 62

转载豆瓣9.5，机器学习“圣经”PRML终于出中文版了！

.....这是一本教科书，包含广泛的练习、对导师的指导，说明在哪里获得完整的解决方案，以及本科课文中必不可少的彩色插图。“这本制作精美的书面向高级本科生、博士生以及研究人员和从业者，主要是在机器学习或相关领域......一个强大的特点是几何插图和直觉的使用......这是一本令人印象深刻且有趣的书，可能构成几门高级统计课程的基础。对于阅读小组来说，这将是一个不错的选择。Bishop希望通过这本书，为读者提供一套全面、连贯的学习教材，让大家能用统一的符号和理论框架，学习不同的机器学习主题。

2025-12-15 17:48:36 68

转载叹为观止！用AI快速生成和优化python代码！

让代码飞：用AI快速生成和优化Python代码》以Python语言为基础，深入探讨如何利用AI技术进行Python代码的生成和优化，并通过100个典型示例和8个实战案例展示AI在Python编程中的具体应用。第4章介绍用AI构建自己的第一个Python项目；《让代码飞：用AI快速生成和优化Python代码》内容丰富，讲解通俗易懂，案例典型、实用，适合对AI编程感兴趣的初学者和想提高Python开发效率的进阶读者阅读，也适合Python开发从业者、AI技术爱好者、大中专院校的学生和相关培训机构的学员阅读。

2025-11-27 10:08:33 70

转载 AI Agent开发，未来三年必学！

基于Ollama、Higress和vLLM、Ray、llama.cpp等工具，并以DeepSeek模型为例，实现模型的私有化部署方案，不仅解决了企业在引入AI技术时的后顾之忧，也为读者提供了可复用的技术框架。在《关于深入实施“人工智能+”行动的意见》的指引下，我国正加速推进人工智能与经济社会各领域的深度融合，力求通过科技、产业、消费、民生、治理及全球合作等多维度的创新，重塑生产生活范式，催生新质生产力。通过丰富的图示和清晰的逻辑，读者能够迅速建立对AI Agent的全面认知，为后续的学习打下坚实的基础。

2025-11-26 10:03:36 78

转载＜span class=“js_title_inner“＞AI Agent开发，未来三年必学！＜/span＞

基于Ollama、Higress和vLLM、Ray、llama.cpp等工具，并以DeepSeek模型为例，实现模型的私有化部署方案，不仅解决了企业在引入AI技术时的后顾之忧，也为读者提供了可复用的技术框架。在《关于深入实施“人工智能+”行动的意见》的指引下，我国正加速推进人工智能与经济社会各领域的深度融合，力求通过科技、产业、消费、民生、治理及全球合作等多维度的创新，重塑生产生活范式，催生新质生产力。通过丰富的图示和清晰的逻辑，读者能够迅速建立对AI Agent的全面认知，为后续的学习打下坚实的基础。

2025-11-26 10:03:36 15

转载 Cursor与 MCP入门重磅新作出版！

本书的目的就是作为你的向导，以通俗易懂的语言和丰富的实战案例，手把手地教你使用Cursor和MCP等工具开发智能应用，无需编程经验。例如，在开发智能旅行规划助手时，程序员不再需要手动编写复杂的路径规划算法，而是通过Cursor和MCP工具快速生成代码，专注于优化用户体验，提供更加个性化的旅行建议。过去，将一个想法变为一个可运行的应用程序，是一条布满荆棘的道路，需要漫长的学习编码、调试和部署的过程。作者黄桂钊在书中采用了通俗易懂的语言，避免了生涩的技术术语，让读者能够快速理解和掌握AI开发的基本概念和方法。

2025-10-24 12:21:15 88

转载＜span class=“js_title_inner“＞Cursor与 MCP入门重磅新作出版！＜/span＞

本书的目的就是作为你的向导，以通俗易懂的语言和丰富的实战案例，手把手地教你使用Cursor和MCP等工具开发智能应用，无需编程经验。例如，在开发智能旅行规划助手时，程序员不再需要手动编写复杂的路径规划算法，而是通过Cursor和MCP工具快速生成代码，专注于优化用户体验，提供更加个性化的旅行建议。过去，将一个想法变为一个可运行的应用程序，是一条布满荆棘的道路，需要漫长的学习编码、调试和部署的过程。作者黄桂钊在书中采用了通俗易懂的语言，避免了生涩的技术术语，让读者能够快速理解和掌握AI开发的基本概念和方法。

2025-10-24 12:21:15 15

转载 AIGC实战工业缺陷检测：从原理到代码

前面已经详细介绍过人机交互以及通过对话提取需求的原理与实现方式，且此案例将会直接基于前面的内容进行方案设计，因此在此案例中不再详细介绍人机交互功能和需求提取的部分，而是重点介绍 AIGC 在机器视觉中的其他重要应用功能。特别是，如果系统部署在硬件资源充足的环境中，则可以实现实时自动学习，从而进一步优化系统的性能和用户体验。注意：AIGC 融合传感器的案例实现完全基于检索式对话系统的方式，而 AIGC 在机器视觉场景中的应用由于涉及较多的用户主观感受，因此无法完全依赖检索式对话系统进行用户需求的直接提取。

2025-10-15 16:53:05 140

转载可以不写，但不能不会！《Python编程从新手到高手》：美亚4.6，Python蟒蛇书系列又添新丁！

即使是拥有21年Python经验的资深开发者也从中发现令人惊叹的实用技巧，例如在with语句中优雅管理多个资源流及其退出清理操作，展现了源于海量实战的、对Python优雅特性的深刻理解和应用。）思维与编码风格——引导读者遵循Python的核心哲学，摒弃非Python的编程习惯，从而不受其他编程语言的影响，写出简洁、优雅且高效的地道Python程序。，不同背景和需求的读者都能获得与其自身情况相匹配的知识和技能提升，开启Python编程的高效学习之旅，实现从新手到高手的华丽转变。

2025-08-05 20:17:32 293

转载实战AI帮你编程！Vibe Coding：不是程序员也能编程！

本书凝结着他们深耕行业的观察洞见、躬身实践的经验沉淀与传道授业的教学智慧，堪称AI时代编程教育的思想结晶。然而，真正的变革需要让更多人了解并掌握这一创新方式，因而，他们合著了本书，希望通过系统化的知识梳理与清晰易懂的阐述，将Vibe编程的理念和方法传递给更广泛的群体。在过去的一年里，从记者到老师，从产品经理到家庭主妇，无数零编程基础的普通人正在用Vibe编程创造能解决实际问题的应用。你无须记忆烦琐的语法规则，也无须深陷复杂的代码调式，只需通过自然语言与AI对话，即可将脑海中的灵感转化为可运行的应用。

2025-07-21 08:52:49 269

转载贝叶斯分类器在OCR中的应用

如图7示，图7(a)是包含训练字符的原图，数字0~9，共10行，每行20个字符。如图4所示，图4(a)为字符粘连的图像，图4(b)是对二值化后的图4(a)进行开运算的结果，由于图4(a)与图3(a)的前景相反，所以用了相反的形态学算法。由于我们是将分割得到的包含字符外接矩形的图像缩放到一个标准尺寸，那么对于有些字体中的个别字符，比如等线字体中的“I”和“-”，就不能分辨开，因为缩放后的图像是一样的。如图5所示，图5(a)是产品包装上常见的点阵字符串，图5(b)是对图5(a)二值化后再腐蚀的结果。

2025-07-03 20:25:26 200

转载 AI新晋顶流！MCP！第一本给程序员看的MCP入门实战书！

详细介绍了Python、TypeScript、Java和Kotlin等不同编程语言的MCP SDK的安装方法与环境要求，并通过一个简单的Python MCP服务器示例展示了基本开发流程。宿主应用程序包含MCP客户端组件，使用MCP连接各种资源的应用程序，例如AI助手（如Claude桌面应用）、开发环境（如Cursor、Cline)和专门的AI工具。作为宿主内部的核心组件，MCP客户端负责与各个服务器建立直接初始化连接，并保持一对一的连接关系，发送请求和接收响应，确保信息的顺畅流通。

2025-07-02 19:50:26 176

转载重磅新书！《大模型应用开发：RAG实战课》

评估是度量RAG系统性能的重要手段。，从RAG技术的基本概念、在大模型应用开发技术演进路径中的位置讲起，深入RAG系统的核心组件、执行流程，再到系统构建的各个环节，包括数据导入、文本分块、信息嵌入、向量存储等，以及系统优化、评估和复杂范式的拓展，形成了一套完整的知识体系。本书从AI Agent的基本概念切入，探讨其理解自然语言、执行任务的原理，深入剖析Agent 的“大脑”（大模型推理能力）、感知力（语言交互和多模态能力）、行动力（语言输出和工具使用）等核心特性，让读者对AI Agent有清晰的认知。

2025-06-05 21:31:58 378

转载经典巨著（中文版）！人工智能三巨头联袂推荐！

在网络模型方面，从单层网络逐步深入多层网络、深度神经网络，详细讲解其结构、功能、优化方法及其在分类、回归等任务中的应用，同时涵盖卷积网络、Transformer等前沿架构及其在计算机视觉、自然语言处理等领域的独特作用。，帮助深度学习的新手及有经验的从业者全面理解支撑深度学习的基础理论，以及现代深度学习架构和技术的关键概念，为读者未来在专业领域的深造打下坚实的基础。如果你读过PRML，读本书时肯定会觉得似曾相识，它们的结构其实非常接近，你可以理解为作者用这十多年来领域的新进展重塑了PRML，就得到了本书。

2025-05-27 16:30:16 182

转载第一本！通用人工智能评测书籍，知名AI科学家朱松纯及团队全新成果！

是我国一流的新型研发机构——北京通用人工智能研究院，朱松纯教授正是通研院院长，在他的引领下，凝聚了数百人四年攻关的成果，写出了这本《通用人工智能标准、评级、测试与架构》的研究目标是寻求统一的理论框架来解释各种智能现象，并研发具有高效的学习和泛化能力，能够根据所处的复杂动态环境自主定义、生成并完成任务的通用智能体，使其。诚然，以 ChatGPT 为代表的问答应用，在自然语言处理任务及基准测试中的表现非常优秀，但这种基于深度学习训练的 AI 框架有着难以克服的缺陷，为通用人工智能的研究提供了系统的理论指导。

2025-04-15 16:18:49 322

转载用DeepSeek搭建AI Agent ！

更好地理解构建个人知识库的步骤和实例，穿插讲解了构建个人知识库所需技术的基础知识和概念，包括：向量数据是什么、为什么要进行数据向量化，以及RAG的概念和应用等。都应该掌握的DeepSeek高级使用方法，帮助我们用DeepSeek搭建智能体和个人知识库，通过API调用进行AI编程，从而在编程之路上实现质的飞跃。此外，书中手把手教学两个极具实用性的应用案例，大家学习后将掌握如何将DeepSeek集成到自己的项目中，提升编程效率，实现智能化功能的快速落地。，巧妙地穿插介绍了智能体和工作流的概念。

2025-04-03 17:16:47 290

转载学术志重磅新书：极速上手DeepSeek，高效做事不内耗！

扫码备注【送书】进群，参与包邮赠送【DeepSeek极速上手：高效做事不内耗】抽奖活动，截止2025-03-17 22:00朋友们，今年是不是被DeepSeek疯狂刷屏啦？看网友用它10分钟写完方案、半小时搞定数据分析，自己想试试却卡在“服务器繁忙，请稍后再试”的痛谁懂啊？现在，学术志推出了写给打工人的DeepSeek指南《DeepSeek极速上手：高效做事不内耗》，由郭泽德、宋义平、朱晔三位专...

2025-03-13 17:02:51 787

转载第一本给程序员看的DeepSeek图书上市了！

扫码备注【送书】进群，参与包邮赠送【DeepSeek 原理与项目实战】抽奖活动，截止2025-03-16 22:00DeepSeek爆火到现在，留给程序员们的时间不多了。仅仅一个多月的时间，国内诸多领域的头部力量纷纷迅速接入DeepSeek。国民级应用如微信、阿里、百度，手机终端厂商荣耀、小米、OPPO、vivo，汽车终端领域的比亚迪、一汽、上汽，还有政企单位、居民服务部门以及各大高校，均积极投...

2025-03-11 11:21:26 174

转载用好DeepSeek-VL2的心法，就在上交大ACM班俞勇教授团队的这本新书里

正文开始前，先派送福利扫码备注【送书】进群，参与包邮赠送【动手学计算机视觉】抽奖活动，截止2025-03-09 22:00下文来源异步图书Part.1视觉多模态模型DeepSeek-VL2发布近日，DeepSeek发布了视觉多模态模型DeepSeek-VL2。该模型在视觉能力上进行了显著升级，采用了MoE（Mixture of Expert）架构和动态切图策略，支持动态分辨率图像处理。对于计...

2025-03-04 20:51:14 294

转载给普通人、打工人与创业者！清华大学DeepSeek最全最强教程！350页PPT直接领取！...

累计350页及视频下载：关注公众号「机器学习与AI生成创作」，后台发消息回复【清华DS】领取！

2025-02-23 10:04:14 120

转载已近2年的消沉！GAN再度归来，模型大幅简化，训练更稳定，逆袭扩散模型？！...

本文来源机器之心编辑部GANs are so back!?2025 年了，GAN 能否击败扩散模型？答案是 Yes！本周五，AI 社区开始讨论一种全新极简主义 GAN（生成对抗网络）。现代版 GAN 基准论文成为了周五 HuggingFace 热度最高的研究。该论文也入选了 NeurIPS 2024。它并不像以往那样走 tricks 路径 —— 通过一场「现代化」改造，GAN 现在可以进行更...

2025-01-11 16:14:26 499

转载抽卡效率提升4.8倍！东北大学等开源优化版Stable-Diffusion.cpp：分辨率越高越快，生成质量更好...

本文来源新智元编辑：LRST【新智元导读】北京大学等研究团队优化了Sdcpp框架，通过引入Winograd算法和多项策略，显著提升了图像生成速度和内存效率，最高可提速4.79倍。在AI生成图像领域，Stable Diffusion已经成为一个里程碑式的工具，凭借其强大的图像生成能力，被广泛应用于艺术创作、商业设计等领域。然而，生成高质量图像的过程常常需要付出大量的时间和内存，这对于硬件资源...

2025-01-02 11:21:47 302

转载普通人怎么用AI？周鸿祎等强烈推荐，一法破万法！

正文开始前，先派送福利扫码备注【送书】进群，参与包邮赠送【AI帮你赢：人人都能用的AI方法论】抽奖活动1，截止2025-01-05 22:00下文来源异步图书Part 1周鸿祎作序推荐，AI帮你赢！红衣大叔周鸿祎最近又搞了新花样，他亲自出演黑客短剧，直接带火360的AI搜索引擎“纳米搜索”。同时，他亲自作序推荐的一本教普通人怎么用AI成为超级个体的好书——由谭少卿老师创作的《AI帮你赢：人...

2025-01-02 11:21:47 463

原创 2025，图像CV算法工程师，如何拥抱 MLLM大模型、Diffusion等前沿技术？

喜迎元旦！【AI生成创作与计算机视觉】一杯奶茶价，跟进AIGC+CV+大模型视觉前沿【AI生成创作与计算机视觉】知识星球2022、2023年开始，基于扩散模型的AI绘画、ChatGPT系列大模型主导的AIGC狂潮已来！大模型下的科研、工业应用方向，已在重构进行中！计算机视觉、图像处理方向已迎来新一轮变革！AIGC将渗透到每一个细分领域！跟进、学习了解最经典、最新、最前沿的AIGC、CV+大语言...

2024-12-31 11:35:22 1408

转载《机器学习漫画小抄》：彩绘插图，简介明晰！爱了！

正文开始前，先派送福利扫码备注【送书】进群，参与包邮赠送【机器学习漫画小抄】抽奖活动，截止2024-12-27 22:00下文来源异步图书今天，小异要向你介绍的是一套在外网爆火的的机器学习闪记卡。这套闪记卡由机器学习大神Chris Albon博士创作，因其言简意赅的语言、易懂易记的彩绘插图、简洁明晰的排版，能帮助学习者像背单词一样轻松搞定机器学习关键概念，而获得了数万人的关注，被超多大咖推荐...

2024-12-24 17:46:01 195

转载 INFP：照片+音频的说话人驱动 | 字节新方案

本文转载自机器之心本文作者来自字节跳动智能创作数字人团队，介绍了名为「INFP」的交互式人像生成技术。利用该技术生成的智能体能像真人一样在多轮对话中实现自由的听说行为以及无缝的状态切换。在大语言模型和 AIGC 的热潮下，科研人员对构建「视觉对话智能体」（Visual Chat Agent）展现出极大兴趣。其中，可实时交互的人像生成技术（Audio-Driven Real-Time Inter...

2024-12-24 17:46:01 631

转载中科大少年班王兵博士：碳基智能—>硅基智能，智能从何而来，将往何去？ | 《智能崛起：AI文明演化史》...

正文开始前，先派送福利扫码备注【送书】进群，参与包邮赠送【智能崛起：AI文明演化史】抽奖活动，截止2024-12-1622:00Part.1智人之上，智能崛起两个月前，正当OpenAI宫斗续集轰轰烈烈地进行的时候，《人类简史》作者赫拉利出版了一本关于信息网络如何塑造、又摧毁我们的认知世界的新书《智人之上》，引发热议。他发出警示：我们正一头扎进可能毁灭我们自身的、由新型信息网络组成的人工智能时代...

2024-12-13 16:53:06 444

转载 Hyper-YOLO：超图计算+目标检测，清华发布，用超图捕捉高阶视觉关联，性能新SOTA...

本文来源新智元编辑：LRST【新智元导读】Hyper-YOLO是一种新型目标检测方法，通过超图计算增强了特征之间的高阶关联，提升了检测性能，尤其在识别复杂场景下的中小目标时表现更出色。YOLO（You Only Look Once）系列是目标检测领域中的主流方法，以其高效性和实时性而著称。然而，现有的YOLO模型在处理跨层特征融合和复杂的高阶特征关系时存在局限，无法充分捕捉跨位置和跨尺度的...

2024-12-13 16:53:06 313

转载 NeurIPS 2024 最佳论文出炉 | 北大字节VAR获最佳论文、厦大清华获亚军

本文来源机器之心编辑部刚刚，人工智能顶会 NeurIPS 公布了今年的最佳论文（包括 Best Paper 和 Best Paper Runner-up，大会注册者可以看到）。一共有两篇论文获得最佳论文奖：一是由北京大学、字节跳动研究者共同完成的《Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale P...

2024-12-04 17:51:57 1040

转载更适合普通人的AI科普！清华大学刘知远团队新作：道尽28位AI天才们的热血传奇...

正文开始前，先派送福利扫码备注【送书】进群，参与包邮赠送【AI群星闪耀时】抽奖活动，截止2024-12-0822:00也可自行购买，专属链接：历史书很小，装不下一个人的灿烂一生；但是星空很大，容得下所有人在历史长河中闪耀。今天小异带来一本新书，由清华大学刘知远团队创作的《AI群星闪耀时》，这本书讲述了AI发展历史上，那些让人心潮澎湃的瞬间，他们就像一颗颗璀璨的星星在夜空中闪耀。书中讲述了28位...

2024-12-04 17:51:57 276

转载高中生！NeurIPS 2024开卷！人大附中、北师大实验中学等摘得3篇Spotlight

本文来源新智元编辑：静音好困【新智元导读】NeurIPS 2024高中生论文录用结果公布！论文接受率仅为6.4%，3名国内学生杀出重围，斩获Spotlight。就在刚刚，NeurIPS 2024首届高中论文录用结果公布了！今年，NeurIPS 2024首次设置了「高中生赛道」，直接将「学好AI要从娃娃抓起」变成了现实。此举曾在今年4月引发激烈的讨论，有人认为这为有科研潜力的高中生提供了宝...

2024-11-21 18:05:53 431 1

转载故事思维，顶会论文的秘诀。。

正文开始前，先派送福利扫码备注【送书】进群，参与包邮赠送【科技论文写作指南】纸质图书抽奖活动，截止2024-11-25晚上10点也可自行购买，专属链接：写论文，大概是每个理工科学生的噩梦。对着电脑屏幕抓耳挠腮，熬夜码字到天明，好不容易憋出几千字，却发现“创新点”写得干巴巴，“摘要”像流水账， “相关工作”更是让人头大。忐忑不安地提交稿件，结果却收到了冷冰冰的拒稿邮件，那种绝望，你懂的！据统计...

2024-11-21 18:05:53 272

转载文生图排行榜第一！创业公司red_panda，中国公司？

本文来源机器之心编辑部「red_panda」（小熊猫）模型有主了。前几天在 Hugging Face 文本转图像排行榜上排名第一的 red_panda，是一个名为 Recraft V3 的模型，由 AI 初创公司 Recraft 提供。Recraft V3 以 1172 的 ELO 评分位居第一，超越了 Midjourney、OpenAI 和其他公司的模型。榜单地址：https://hugg...

2024-11-20 10:01:16 1072

转载高中生都能读懂！《破解深度学习》让AI不再难学！

正文开始前，先派送福利扫码备注【送书】进群，参与免费寄送【破解深度学习（基础篇）】或【破解深度学习（核心篇）】（2选1）纸质图书抽奖活动，截止2024-11-05晚上10点也可自行购买，专属链接：作者：瞿炜，前新东方AI研究院创始院长，中国科学院大学教授、模式识别国家重点实验室客座研究员，哈佛大学、京都大学客座教授，美国伊利诺伊大学人工智能博士。他是国家部委特聘专家，曾任多个国际知名学术期刊编委...

2024-11-01 15:05:12 861

转载 OmniGen：新扩散模型，一统图像生成，架构还高度简化、易用

本文来源机器之心编辑部大型语言模型（LLM）的出现统一了语言生成任务，并彻底改变了人机交互。然而，在图像生成领域，能够在单一框架内处理各种任务的统一模型在很大程度上仍未得到探索。近日，智源推出了新的扩散模型架构 OmniGen，一种新的用于统一图像生成的多模态模型。OmniGen 具有以下特点：统一性：OmniGen 天然地支持各种图像生成任务，例如文生图、图像编辑、主题驱动生成和视觉条件生成...

2024-11-01 15:05:12 915

原创太全！30+方向大梳理！ECCV2024上的AIGC扩散模型在研究什么？！

CVPR 2024 | 绝！diffusion 扩散模型100+篇论文、40+方向30个方向130篇！CVPR 2023最全AIGC论文30个方向！ICCV 2023 最全AIGC论文25个方向！CVPR 2022 GAN论文汇总35个方向！ICCV 2021 最全GAN论文汇总超110篇！CVPR 2021 最全GAN论文梳理超100篇！CVPR 2020 最全GAN论文梳理在最新的视觉顶会...

2024-10-21 18:32:11 2838

空空如也

空空如也