智源社区-CSDN博客

原创专访KAUST诸葛鸣晨丨2026 Agent最大突破是“递归自进化”，三年后有望实现“神经计算机”

也许你会意外的发现，2025年David Silver和Richard Sutton主推的Learning from Experience，以及2025年下半年到2026年上半年硅谷各大公司的老大比如Elon、Sam、Dario最近爱谈的Recursive Self-Improvement，三年前我以精准的terminology将其写入 MetaGPT 附录，如今它们正在逐步成为行业讨论的重点。最近有一个叫Ralph Loop的概念，他们强调在循环过程中，重要的不仅仅是智能体的能力，还需要好的评测手段。

2026-03-24 11:57:57 295

转载智源Workshop33期丨Agent如何进化，内行人视角看OpenClaw

Agent 正从实验室的构想加速走向产业实践的前沿，从单一大模型的“单兵作战”到多智能体系统的“兵团协作”，从封闭环境的有限探索到开放生态的无限可能，智能体展示了 AI 在复杂场景下的协同能力，Agent正在经历一场前所未有的“模块重组”，其进化路径正在被重新定义。本期智源Workshop，我们特邀六位深度参与这场变革的学术工作者和探索者，以内行人的视角看OpenClaw现象，探路Agent未来发展趋势。

2026-03-16 17:56:46 15

原创新“顶流”出道！让智源Robo，承包你的科研日常！

每一位搞科研的我们，都不满足于微小的涟漪，都坚信扎实的研究、默默的坚守与开放的行动，终将汇聚成推动技术前进的巨浪。左手是熬夜深耕的学术理想，右手是盼望丰收的烟火现实，两者都是咱们向上的劲儿！反复“对话”，一次次迭代优化，一点点调试参数，有崩溃、有挫败，但只要看到模型变好，就觉得一切都值得，这就是咱们AI科研人最真实的日常呀。科研就像种萝卜，越专注、越投入，就越陷越深～码代码、改论文，一晃就是一下午，哪怕熬到头疼，看到一点进展就又充满动力，这种痛并快乐着的沉浸感，是咱们科研人独有的浪漫！

2026-03-10 18:11:40 247

转载携手ICLR 2026 RSI Workshop，解锁 AI 自进化新可能

它曾被视为遥不可及的科幻愿景，而今正成为迈向通用人工智能（AGI）的关键路径。想要使RSI成为可靠、可衡量和可部署的技术，需要有原则的方法、系统设计和评估。）获取最新动态，期待与各位相聚里约热内卢，现场交流探讨，共探 AI 递归自改进的未来之路，解锁通用人工智能发展新可能！参与支持，旨在汇聚全球顶尖研究者，共同探讨如何让AI实现可衡量、可靠且可部署的自我进化。：参数、世界模型、记忆、工具与技能、架构等。：软件、游戏、机器人、科学发现、企业应用等。：奖励/价值学习、模仿学习、进化搜索等。

2026-03-03 12:25:04 49

转载 Nature｜全球首个医学循证推理DeepRare智能体，上交助理教授吴超逸分享

累计开源8个医学基础模型、7个大规模数据集和4个评测集，构建了当前医疗领域最大规模的多语种、多模态开源训练语料（涵盖1600万样本、255亿Token、六大语种），在GitHub及HuggingFace上收获超4600星标与24万次下载。论文数据显示，在仅提供患者临床表型信息而不包含基因数据的情况下，DeepRare展现出了惊人的“表型解码”能力。在多模态数据的加持下，其在复杂病例中的综合首位诊断准确率（Recall@1）一举突破70.6%，显著优于目前国际通用的Exomiser工具（53.2%）。

2026-03-03 12:25:04 35

转载 2026青源学术年会成功举办，青年力量共探“走向世界的模型”

从开发高精度触觉传感器，到推动AI在生物医药领域的应用，青年学者们的研究充满创新活力，彰显了全球华人青年AI研究社区的蓬勃生机。10日恰逢中国传统小年，年会特别策划了温馨的“小年夜”活动。随后的“围炉夜话”环节更是气氛热烈，大家围炉而坐、畅所欲言，在观点的交锋和跨学科对话中，深化了友谊，拓展了合作的边界。本届年会以“AI 前瞻：走向世界的模型”为主题，汇聚了来自中国、新加坡、美国、加拿大、澳大利亚、德国、沙特等10余个国家和地区的40余位优秀青年华人学者，为AI领域的青年力量搭建了开放、深入的交流平台。

2026-02-13 14:52:24 73

转载本周四｜香港大学&KiMi，开源OpenCUA：每人都可造专属电脑智能体

（3）一个可扩展的处理流程，能将操作演示转化为带有反思性长链思维推理（Chain-of-Thought）的状态-动作对，从而在数据规模扩大时持续保持性能提升。特别是OpenCUA-32B在OSWorld-Verified测试中取得了平均34.8%的成功率，成为开源模型中的新标杆（SOTA），并超过了OpenAI的CUA模型（GPT-4o）。由于这些代理将越来越多地介入我们的数字交互，并代表我们执行具有实际影响的决策，研究界迫切需要开放的CUA框架，以研究其能力、局限性和潜在风险。计算机使用任务跨操作系统。

2026-02-04 12:03:42 61

原创刘知远深度分享：AI 浪潮之下，泳姿不重要，关键是先入水｜智源专访

当 AI 领域的“玩家们”执着于 “更大模型、更多数据” 的规模扩张洪流时，刘知远早已锚定了一条务实且坚定的差异化路径。他跳出单纯追逐参数的内卷，以密度法则重构模型价值，在端侧智能与产研融合中探寻通用人工智能的落地密码。这位深耕 NLP 领域近二十年的清华大学长聘教授、面壁智能联合创始人和青源会发起人，见证并推动了中国的大模型浪潮，也在技术热潮中保持独有的清醒。从早年跟进 word2vec 深耕知识表示学习，到主导研发 ERNIE 预训练模型、参与打造 “悟道” 万亿大模型，再到推出 MiniCPM 端侧模

2026-02-04 12:03:42 588

转载预告 | 2026 智源学者年会重磅来袭！

智源学者年会是智源研究院面向智源学者、顶尖AI研究者举办的年度生态大会，立足人工智能前沿、推动学术生态建设。大会将正式揭晓2025年度智源学者计划入选名单，并迎来新晋学者的首次集体亮相，同时由基础软硬件、具身智能等前沿方向的学者作报告分享。大会旨在搭建薪火相传的交流桥梁，凝聚学界共识，共迎产业变革，共塑可持续发展的AI学术生态高地。2月3日，让我们相聚智源学者年会，与百余位顶尖同行共话人工智能未来，在思想碰撞中寻找创新答案！本次活动以邀请制为主，秉承开源开放的理念，特开放部分公众报名名额。

2026-01-28 14:41:21 99

转载＜span class=“js_title_inner“＞预告 | 2026 智源学者年会重磅来袭！＜/span＞

智源学者年会是智源研究院面向智源学者、顶尖AI研究者举办的年度生态大会，立足人工智能前沿、推动学术生态建设。大会将正式揭晓2025年度智源学者计划入选名单，并迎来新晋学者的首次集体亮相，同时由基础软硬件、具身智能等前沿方向的学者作报告分享。大会旨在搭建薪火相传的交流桥梁，凝聚学界共识，共迎产业变革，共塑可持续发展的AI学术生态高地。2月3日，让我们相聚智源学者年会，与百余位顶尖同行共话人工智能未来，在思想碰撞中寻找创新答案！本次活动以邀请制为主，秉承开源开放的理念，特开放部分公众报名名额。

2026-01-28 14:41:21 36

转载直播｜AAAI 2026 Outstanding Paper Award 微软亚洲研究院，多模态表征模型能力边界LLM2CLIP

受大语言模型（LLM）在语言理解与知识建模方面快速进展的启发，本报告将介绍 LLM2CLIP：一种将 LLM 高效引入 CLIP 体系、显著扩展其多模态表征能力的通用框架。具体而言，LLM2CLIP 首先对 LLM 进行面向 CLIP 场景的“嵌入化”（embedding-ization），随后通过一个轻量级适配器将其与预训练的 CLIP 视觉编码器进行耦合，仅需在数百万规模的图文数据上进行微调即可完成训练，无需大规模重训模型。杨一帆，北京大学硕士。本期报告将由微软亚洲研究院杨一帆进行分享。

2026-01-27 13:41:18 122

转载直播｜线性注意力最新工作，复旦大学，从动力学微分方程中得到无误差的线性注意力

线性时间注意力和状态空间模型（SSM）有望解决采用软最大注意力的长上下文语言模型中的二次成本瓶颈。通过大量实验，我们证明EFLA在噪声环境中实现了稳健的性能，实现了比DeltaNet更低的语言建模困惑度和更优于下游基准测试的表现，而无需引入额外参数。我们的工作为构建高保真度、可扩展的线性时间注意力模型提供了新的理论基础。他曾共同作者多项具有影响力的工作，包括 *ChemLLM*、*ChemVLM* 与 *LLama-berry*，推动了大语言模型在科学发现与推理方面的前沿进展。

2026-01-27 13:41:18 101

转载＜span class=“js_title_inner“＞直播｜线性注意力最新工作，复旦大学，从动力学微分方程中得到无误差的线性注意力＜/span＞

线性时间注意力和状态空间模型（SSM）有望解决采用软最大注意力的长上下文语言模型中的二次成本瓶颈。通过大量实验，我们证明EFLA在噪声环境中实现了稳健的性能，实现了比DeltaNet更低的语言建模困惑度和更优于下游基准测试的表现，而无需引入额外参数。我们的工作为构建高保真度、可扩展的线性时间注意力模型提供了新的理论基础。他曾共同作者多项具有影响力的工作，包括 *ChemLLM*、*ChemVLM* 与 *LLama-berry*，推动了大语言模型在科学发现与推理方面的前沿进展。

2026-01-27 13:41:18 57

转载＜span class=“js_title_inner“＞直播｜AAAI 2026 Outstanding Paper Award 微软亚洲研究院，多模态表征模型能力边界LLM2CLIP＜/span＞

受大语言模型（LLM）在语言理解与知识建模方面快速进展的启发，本报告将介绍 LLM2CLIP：一种将 LLM 高效引入 CLIP 体系、显著扩展其多模态表征能力的通用框架。具体而言，LLM2CLIP 首先对 LLM 进行面向 CLIP 场景的“嵌入化”（embedding-ization），随后通过一个轻量级适配器将其与预训练的 CLIP 视觉编码器进行耦合，仅需在数百万规模的图文数据上进行微调即可完成训练，无需大规模重训模型。在ICCV、ACL、AAAI、WWW、MM等国际顶级会议发表多篇高水平论文。

2026-01-27 13:41:18 48

转载年度高能回顾！最受欢迎、顶会最佳、经典品读，26篇精华带你掌握全年脉络

我们仔细探寻，会发现其中蕴涵了丰富的宝藏——从压缩与智能的关系，到强化学习、正则化技巧，乃至持续学习，都能从这些经典工作之中汲取灵感。回顾了从 RLHF 到 RLVR 的关键方法演进，还深入探讨了训练框架、前沿问题、资源需求与实际应用场景，清晰呈现了大模型与环境在长期进化中的交互机制。利用上下文的稀疏结构，在保持困惑度不变的前提下，将首词生成时间加速30.85倍。系统性地分析了门控机制对大语言模型的有效性，并通过一系列控制实验证明了门控机制的有效性来源于增强了注意力机制中的非线性与提供输入相关的稀疏性。

2026-01-20 11:46:29 96

转载直播｜给机器人装上「透明手指」

机器人在复杂真实环境中的操作常常面临感知不足的挑战：视觉容易因遮挡而失效，触觉只能在接触发生后提供局部信息；在视觉受限而触觉未被激活的“最后一厘米”关键阶段，环境感知能力的空白使机器人在精细和接触丰富的任务中表现受限。TacThru 通过几项简洁而高效的设计，使机器人能同步获取指尖视角下高质量的视觉与触觉信号，无需额外控制逻辑在两种模态间切换。李宇飏，北京大学人工智能研究院2024级博士研究生，导师为朱毅鑫助理教授，研究方向为机器人的多模态感知及其支撑的灵巧操作。月21日（周三）14:30-15:30。

2026-01-20 11:46:29 65

转载 BERT，开启上下文之门｜品读经典第3期

而BERT对上下文敏感表示的追求，不仅直接催生了RoBERTa、ALBERT、DeBERTa等一系列重要变体，更启发了跨模态预训练模型（如ViLBERT、VideoBERT）的发展，推动表示学习从“静态词向量”走向“动态语境建模”。在工程层面，基于BERT的模型已成为工业界NLP系统的基石，从搜索引擎、智能客服到内容理解，其双向编码的思想至今仍在持续释放价值。2018年，以Word2Vec为代表的静态词向量虽解决了词汇的分布式表示问题，却困于“一词一向量”的局限，无法捕捉语境中微妙的意义流转。

2026-01-20 11:46:29 120

转载直播｜小模型协调大能力，英伟达研究院最新工作

该工作提出一种新的智能系统范式：使用一个轻量级的“编排器”模型，通过强化学习学习如何在不同任务中动态调度多种工具与模型，在正确性、成本和用户偏好之间进行联合优化。实验表明，一个仅 8B 参数的编排模型即可在 Humanity’s Last Exam、FRAMES、Tau²-Bench 等高难度基准上取得优于或接近顶级大模型的性能，同时显著降低推理成本，展示了“以小模型协调大能力”的高效智能新路径。统一的工具调用接口，使各类工具（网络搜索、代码解释器、专业模型、大型通用模型等）均可参与协同；

2026-01-20 11:46:29 88

转载＜span class=“js_title_inner“＞直播｜小模型协调大能力，英伟达研究院最新工作＜/span＞

该工作提出一种新的智能系统范式：使用一个轻量级的“编排器”模型，通过强化学习学习如何在不同任务中动态调度多种工具与模型，在正确性、成本和用户偏好之间进行联合优化。实验表明，一个仅 8B 参数的编排模型即可在 Humanity’s Last Exam、FRAMES、Tau²-Bench 等高难度基准上取得优于或接近顶级大模型的性能，同时显著降低推理成本，展示了“以小模型协调大能力”的高效智能新路径。统一的工具调用接口，使各类工具（网络搜索、代码解释器、专业模型、大型通用模型等）均可参与协同；

2026-01-20 11:46:29 36

转载＜span class=“js_title_inner“＞直播｜给机器人装上「透明手指」＜/span＞

机器人在复杂真实环境中的操作常常面临感知不足的挑战：视觉容易因遮挡而失效，触觉只能在接触发生后提供局部信息；在视觉受限而触觉未被激活的“最后一厘米”关键阶段，环境感知能力的空白使机器人在精细和接触丰富的任务中表现受限。TacThru 通过几项简洁而高效的设计，使机器人能同步获取指尖视角下高质量的视觉与触觉信号，无需额外控制逻辑在两种模态间切换。李宇飏，北京大学人工智能研究院2024级博士研究生，导师为朱毅鑫助理教授，研究方向为机器人的多模态感知及其支撑的灵巧操作。月21日（周三）14:30-15:30。

2026-01-20 11:46:29 30

原创专访MIT刘子鸣丨另辟蹊径，不赌规模：Physics of AI 是通往 AGI 的“科学路径”

至于研究目标，短期的话，三年以内，我核心就是推进 Physics of AI 这条研究线，观察更多相关现象，也会把这些研究分享给社区，非常欢迎社区的人一起来加入我们的这项研究工作。这些小观察现在还是出于好奇心驱动，但最终，当我们积累了足够多的小观察，到了某个节点后，我们就能顿悟，明白这些小观察之间是怎么联系起来的。不过我觉得，随着我们做更多的玩具实验，比如测试一个玩具模型各个方面的性质，在不同层次上对它进行测量，通过测量不同的东西，或许就能观察到不同层次、不同观测量下展现出的各种现象。

2026-01-16 12:04:48 399

原创＜span class=“js_title_inner“＞专访MIT刘子鸣丨另辟蹊径，不赌规模：Physics of AI 是通往 AGI 的“科学路径”＜/span＞

至于研究目标，短期的话，三年以内，我核心就是推进 Physics of AI 这条研究线，观察更多相关现象，也会把这些研究分享给社区，非常欢迎社区的人一起来加入我们的这项研究工作。这些小观察现在还是出于好奇心驱动，但最终，当我们积累了足够多的小观察，到了某个节点后，我们就能顿悟，明白这些小观察之间是怎么联系起来的。不过我觉得，随着我们做更多的玩具实验，比如测试一个玩具模型各个方面的性质，在不同层次上对它进行测量，通过测量不同的东西，或许就能观察到不同层次、不同观测量下展现出的各种现象。

2026-01-16 12:04:48 653

转载智源发布2026十大AI技术趋势：认知、形态、基建三重变革，驱动AI迈入价值兑现期

当AI大模型开始尝试理解并预测物理世界的运动规律，一场深刻的范式变革正在发生。2026年1月8日，北京智源人工智能研究院（以下简称“智源研究院”）发布年度报告《2026十大AI技术趋势》。报告指出，人工智能的演进核心正发生关键转移：从追求参数规模的语言学习，迈向对物理世界底层秩序的深刻理解与建模，行业技术范式迎来重塑。智源研究院“2026十大AI技术趋势”发布会现场开场致辞中，智源研究院理事长黄铁军分享了他的技术趋势观察：AI的发展要重视“结构决定功能，功能塑造结构”的相互作用。当前人工智能正从功能模仿转向

2026-01-08 17:54:00 502

转载＜span class=“js_title_inner“＞智源发布2026十大AI技术趋势：认知、形态、基建三重变革，驱动AI迈入价值兑现期＜/span＞

其中，蚂蚁推出的全模态AI助手“灵光”与AI健康应用“蚂蚁阿福”，分别在超级应用与健康垂直领域进行探索。在企业端，经历早期概念验证的“幻灭期”后，AI正凭借更好的数据治理与行业标准接口，在垂直领域孕育出真正可衡量商业价值的产品。报告指出，人工智能的演进核心正发生关键转移：从追求参数规模的语言学习，迈向对物理世界底层秩序的深刻理解与建模，行业技术范式迎来重塑。“Next-State Prediction”（NSP）为代表的新范式，正推动AI从数字空间的“感知”迈向物理世界的“认知”与“规划”。

2026-01-08 17:54:00 50

转载智源TALK｜智能体系统PiFlow，基于信息论的自动化科学发现，西湖大学&浙江大学

实验表明，与基准的纯LLM智能体系统相比，PiFlow在纳米螺旋结构优化、生物分子活性优化、超导体候选材料发现三个任务中平均提升了73.55%的发现效率（以AUC衡量）和94.06%的解质量（以SQ衡量）。现有大语言模型多智能体系统在自动化科学发现中展现出巨大潜力，但往往存在假设缺乏方向性、证据与假设联系模糊、泛化能力有限等问题。蒲应明，论文一作，西湖大学博士生，研究兴趣为AI智能体用于科学发现，主要基于大语言模型多智能体系统，实现高效的规划算法和决策机制。本期报告将由西湖大学蒲应明进行分享。

2025-12-24 12:36:18 97

原创 Agentic Web是下一代互联网的终极形态？ANP 发起人常高伟解析丨智源专访

智能体的身份、发现和描述，我一直认为是智能体协议的三大核心组件，用来解决行业内智能体交互的核心痛点。现在整个社区的核心知识资产还在我名下，后续会完成捐赠，未来在基金会框架下进行更开放、中立、非营利的治理，不被任何公司控制，这一直是我们社区追求的目标。当时我有个核心判断：未来的智能体之间肯定是开放互联的，未来的智能体互联网也必然是开放生态，而不是现在这样的封闭生态。最开始做的时候特别难，整个行业里了解协议的人不多，知道智能体为什么需要协议的人就更少了，要把这个逻辑讲清楚需要很长链路，不一定所有人都能听懂。

2025-12-24 12:36:18 1082

原创＜span class=“js_title_inner“＞Agentic Web是下一代互联网的终极形态？ANP 发起人常高伟解析丨智源专访＜/span＞

智能体的身份、发现和描述，我一直认为是智能体协议的三大核心组件，用来解决行业内智能体交互的核心痛点。现在整个社区的核心知识资产还在我名下，后续会完成捐赠，未来在基金会框架下进行更开放、中立、非营利的治理，不被任何公司控制，这一直是我们社区追求的目标。当时我有个核心判断：未来的智能体之间肯定是开放互联的，未来的智能体互联网也必然是开放生态，而不是现在这样的封闭生态。最开始做的时候特别难，整个行业里了解协议的人不多，知道智能体为什么需要协议的人就更少了，要把这个逻辑讲清楚需要很长链路，不一定所有人都能听懂。

2025-12-24 12:36:18 582

转载＜span class=“js_title_inner“＞智源TALK｜智能体系统PiFlow，基于信息论的自动化科学发现，西湖大学&amp；浙江大学＜/span＞

实验表明，与基准的纯LLM智能体系统相比，PiFlow在纳米螺旋结构优化、生物分子活性优化、超导体候选材料发现三个任务中平均提升了73.55%的发现效率（以AUC衡量）和94.06%的解质量（以SQ衡量）。现有大语言模型多智能体系统在自动化科学发现中展现出巨大潜力，但往往存在假设缺乏方向性、证据与假设联系模糊、泛化能力有限等问题。蒲应明，论文一作，西湖大学博士生，研究兴趣为AI智能体用于科学发现，主要基于大语言模型多智能体系统，实现高效的规划算法和决策机制。本期报告将由西湖大学蒲应明进行分享。

2025-12-24 12:36:18 21

原创报名丨智源2026十大趋势发布会，获取你的2026年AI发展路线图

当 2025 的时钟走向终点，AI 的下一段旅程已蓄势待发。1 月 8 日，让我们与智源研究院一起，在趋势中看见机遇，在共识中凝聚力量。毕竟，真正的先行者，这种迅猛发展既带来了效率跃升与模式创新，也伴随着技术路线的多元分化、应用落地的复杂挑战与安全治理的迫切需求。从实验室的算法迭代到千行百业的生态重构，AI 已经深入生产生活的每个角落，成为驱动经济社会变革的。每一次范式突破、每一次技术融合，都在催生新的产业图景与未来的可能性。，提炼真正决定未来的关键趋势，锚定2026年AI发展的核心坐标。

2025-12-23 12:44:44 757

原创＜span class=“js_title_inner“＞报名丨智源2026十大趋势发布会，获取你的2026年AI发展路线图＜/span＞

当 2025 的时钟走向终点，AI 的下一段旅程已蓄势待发。1 月 8 日，让我们与智源研究院一起，在趋势中看见机遇，在共识中凝聚力量。毕竟，真正的先行者，这种迅猛发展既带来了效率跃升与模式创新，也伴随着技术路线的多元分化、应用落地的复杂挑战与安全治理的迫切需求。从实验室的算法迭代到千行百业的生态重构，AI 已经深入生产生活的每个角落，成为驱动经济社会变革的。每一次范式突破、每一次技术融合，都在催生新的产业图景与未来的可能性。，提炼真正决定未来的关键趋势，锚定2026年AI发展的核心坐标。

2025-12-23 12:44:44 51

原创当数据见顶，AI的下一次跃迁靠什么？南洋理工刘子纬给出“第二条增长曲线”丨智源专访

真正的世界模型应当揭示世界的运作规律，这包含三个层面：一是内在因果规律，二是智能体与世界的交互，三是智能体之间的交互。从早期提出影响广泛的CelebA、DeepFashion等数据集，到在长尾学习、提示学习、三维视觉等领域确立起新的技术范式，再到如今致力于推动动态世界模型与多模态深度融合——刘子纬的研究始终贯穿着一条清晰的脉络：以问题本质为起点，以范式创新为驱动，在学术与工业的交汇处拓展人工智能的边界。第三，探索社会智能，理解多智能体间的交互与合作，以及人和智能体的交互。这里的界面指用户接入的入口。

2025-12-18 12:04:16 561

转载 CAAI 2025 社会计算青年科学家大会在京举行

下午，大会围绕社会计算的不同研究取向设置了三个分组讨论环节，并由评估专家对各组成果进行了集中点评，系统呈现了社会计算在理论构建、技术反思与现实应用层面的多维进展。聚焦社会计算前沿问题，汇聚来自人工智能、计算社会科学、心理学与社会科学等领域的专家学者与青年科研人员，围绕社会计算的理论基础、方法体系与现实应用展开深入交流。从政治传播与认知视角出发，分析深度伪造政治视频的视觉叙事与情绪认知特征，指出相关内容在意识形态表达和呈现形式上的独特性，可能模糊受众对信息真实性的判断；，以增强理论框架的解释力与区分度。

2025-12-18 12:04:16 120

原创＜span class=“js_title_inner“＞当数据见顶，AI的下一次跃迁靠什么？南洋理工刘子纬给出“第二条增长曲线”丨智源专访＜/span＞

真正的世界模型应当揭示世界的运作规律，这包含三个层面：一是内在因果规律，二是智能体与世界的交互，三是智能体之间的交互。从早期提出影响广泛的CelebA、DeepFashion等数据集，到在长尾学习、提示学习、三维视觉等领域确立起新的技术范式，再到如今致力于推动动态世界模型与多模态深度融合——刘子纬的研究始终贯穿着一条清晰的脉络：以问题本质为起点，以范式创新为驱动，在学术与工业的交汇处拓展人工智能的边界。第三，探索社会智能，理解多智能体间的交互与合作，以及人和智能体的交互。这里的界面指用户接入的入口。

2025-12-18 12:04:16 540

转载＜span class=“js_title_inner“＞CAAI 2025 社会计算青年科学家大会在京举行＜/span＞

下午，大会围绕社会计算的不同研究取向设置了三个分组讨论环节，并由评估专家对各组成果进行了集中点评，系统呈现了社会计算在理论构建、技术反思与现实应用层面的多维进展。聚焦社会计算前沿问题，汇聚来自人工智能、计算社会科学、心理学与社会科学等领域的专家学者与青年科研人员，围绕社会计算的理论基础、方法体系与现实应用展开深入交流。从政治传播与认知视角出发，分析深度伪造政治视频的视觉叙事与情绪认知特征，指出相关内容在意识形态表达和呈现形式上的独特性，可能模糊受众对信息真实性的判断；，以增强理论框架的解释力与区分度。

2025-12-18 12:04:16 45

转载 NeurIPS 2025最佳论文，一作阿里通义千问邱子涵分享

此外团队还进一步发现了门控机制能消除注意力池（Attention Sink）和巨量激活（Massive Activation）等现象，提高模型的训练稳定性，极大程度减少了训练过程中的损失波动（loss spike）。团队在各个尺寸、架构、训练数据规模上验证了方法的有效性，并最终成功运用到了 Qwen3-Next 模型中。已在 NeurIPS、ICLR、ACL、EMNLP、NAACL 等会议发表十余篇论文，其中一作论文荣获 NeurIPS 2025 最佳论文奖和 NAACL 2024 杰出论文奖。

2025-12-15 11:57:11 681

原创 2026年见分晓！自变量王潜揭秘具身智能唯一破局之路丨智源专访

我原本就从事机器人领域的研究，当时便想，或许接下来可以继续深耕机器人领域，机器人行业等待了数十年的金钥匙，其实已经摆在我们面前，那就是如今语言模型所采用的这套方法论，于是便考虑继续投身这一事业。我当时认为，机器人领域此前一直受数据数量问题制约，这与如今我们所说的数据制约还不相同——以前行业内仍以纯粹的强化学习为主，而强化学习面临的问题是，随着任务难度不断提升，每个任务所需的数据量呈指数级增长，从理论上讲，我们或许无法沿着这条路一直推进到真正意义上的通用人工智能，或是物理世界的通用人工智能。

2025-12-10 12:02:00 823

转载中国具身全明星，2025具身智能年终展望| 记智源具身OpenDay

2025年已经渐进尾声，具身智能的浪潮正从技术创新的实验室，涌向产业落地的深水区。数据闭环和世界模型不再是论文里的名词，而是决定一个机器人能否在真实物理世界中“活”下来的核心。泡沫在退去，价值在沉淀，2025年是具身智能告别“炫技”，真正开始“做事”的一年。为看清前路、凝聚共识，11月20日的智源具身OpenDay汇聚了来自学界、产业界与投资界的顶尖头脑，围绕“模型、硬件、产业”三大核心战场，展开了一场深入而务实的思辨。智源研究院最新发布的Emu3.5世界模型，通过海量视频数据学习，将多模态理解与生成的边界

2025-11-24 18:02:02 250

空空如也

空空如也