• 博客(1386)
  • 收藏
  • 关注

转载 年度高能回顾!最受欢迎、顶会最佳、经典品读,26篇精华带你掌握全年脉络

我们仔细探寻,会发现其中蕴涵了丰富的宝藏——从压缩与智能的关系,到强化学习、正则化技巧,乃至持续学习,都能从这些经典工作之中汲取灵感。回顾了从 RLHF 到 RLVR 的关键方法演进,还深入探讨了训练框架、前沿问题、资源需求与实际应用场景,清晰呈现了大模型与环境在长期进化中的交互机制。利用上下文的稀疏结构,在保持困惑度不变的前提下,将首词生成时间加速30.85倍。系统性地分析了门控机制对大语言模型的有效性,并通过一系列控制实验证明了门控机制的有效性来源于增强了注意力机制中的非线性与提供输入相关的稀疏性。

2026-01-20 11:46:29 13

转载 直播|给机器人装上「透明手指」

机器人在复杂真实环境中的操作常常面临感知不足的挑战:视觉容易因遮挡而失效,触觉只能在接触发生后提供局部信息;在视觉受限而触觉未被激活的“最后一厘米”关键阶段,环境感知能力的空白使机器人在精细和接触丰富的任务中表现受限。TacThru 通过几项简洁而高效的设计,使机器人能同步获取指尖视角下高质量的视觉与触觉信号,无需额外控制逻辑在两种模态间切换。李宇飏,北京大学人工智能研究院2024级博士研究生,导师为朱毅鑫助理教授,研究方向为机器人的多模态感知及其支撑的灵巧操作。月21日(周三)14:30-15:30。

2026-01-20 11:46:29 13

转载 BERT,开启上下文之门|品读经典第3期

而BERT对上下文敏感表示的追求,不仅直接催生了RoBERTa、ALBERT、DeBERTa等一系列重要变体,更启发了跨模态预训练模型(如ViLBERT、VideoBERT)的发展,推动表示学习从“静态词向量”走向“动态语境建模”。在工程层面,基于BERT的模型已成为工业界NLP系统的基石,从搜索引擎、智能客服到内容理解,其双向编码的思想至今仍在持续释放价值。2018年,以Word2Vec为代表的静态词向量虽解决了词汇的分布式表示问题,却困于“一词一向量”的局限,无法捕捉语境中微妙的意义流转。

2026-01-20 11:46:29 14

转载 直播|小模型协调大能力,英伟达研究院最新工作

该工作提出一种新的智能系统范式:使用一个轻量级的“编排器”模型,通过强化学习学习如何在不同任务中动态调度多种工具与模型,在正确性、成本和用户偏好之间进行联合优化。实验表明,一个仅 8B 参数的编排模型即可在 Humanity’s Last Exam、FRAMES、Tau²-Bench 等高难度基准上取得优于或接近顶级大模型的性能,同时显著降低推理成本,展示了“以小模型协调大能力”的高效智能新路径。统一的工具调用接口,使各类工具(网络搜索、代码解释器、专业模型、大型通用模型等)均可参与协同;

2026-01-20 11:46:29 12

原创 专访MIT刘子鸣丨另辟蹊径,不赌规模:Physics of AI 是通往 AGI 的“科学路径”

至于研究目标,短期的话,三年以内,我核心就是推进 Physics of AI 这条研究线,观察更多相关现象,也会把这些研究分享给社区,非常欢迎社区的人一起来加入我们的这项研究工作。这些小观察现在还是出于好奇心驱动,但最终,当我们积累了足够多的小观察,到了某个节点后,我们就能顿悟,明白这些小观察之间是怎么联系起来的。不过我觉得,随着我们做更多的玩具实验,比如测试一个玩具模型各个方面的性质,在不同层次上对它进行测量,通过测量不同的东西,或许就能观察到不同层次、不同观测量下展现出的各种现象。

2026-01-16 12:04:48 243

转载 智源发布2026十大AI技术趋势:认知、形态、基建三重变革,驱动AI迈入价值兑现期

当AI大模型开始尝试理解并预测物理世界的运动规律,一场深刻的范式变革正在发生。2026年1月8日,北京智源人工智能研究院(以下简称“智源研究院”)发布年度报告《2026十大AI技术趋势》。报告指出,人工智能的演进核心正发生关键转移:从追求参数规模的语言学习,迈向对物理世界底层秩序的深刻理解与建模,行业技术范式迎来重塑。智源研究院“2026十大AI技术趋势”发布会现场开场致辞中,智源研究院理事长黄铁军分享了他的技术趋势观察:AI的发展要重视“结构决定功能,功能塑造结构”的相互作用。当前人工智能正从功能模仿转向

2026-01-08 17:54:00 157

转载 智源TALK|智能体系统PiFlow,基于信息论的自动化科学发现,西湖大学&浙江大学

实验表明,与基准的纯LLM智能体系统相比,PiFlow在纳米螺旋结构优化、生物分子活性优化、超导体候选材料发现三个任务中平均提升了73.55%的发现效率(以AUC衡量)和94.06%的解质量(以SQ衡量)。现有大语言模型多智能体系统在自动化科学发现中展现出巨大潜力,但往往存在假设缺乏方向性、证据与假设联系模糊、泛化能力有限等问题。蒲应明,论文一作,西湖大学博士生,研究兴趣为AI智能体用于科学发现,主要基于大语言模型多智能体系统,实现高效的规划算法和决策机制。本期报告将由西湖大学蒲应明进行分享。

2025-12-24 12:36:18 50

原创 Agentic Web是下一代互联网的终极形态?ANP 发起人常高伟解析丨智源专访

智能体的身份、发现和描述,我一直认为是智能体协议的三大核心组件,用来解决行业内智能体交互的核心痛点。现在整个社区的核心知识资产还在我名下,后续会完成捐赠,未来在基金会框架下进行更开放、中立、非营利的治理,不被任何公司控制,这一直是我们社区追求的目标。当时我有个核心判断:未来的智能体之间肯定是开放互联的,未来的智能体互联网也必然是开放生态,而不是现在这样的封闭生态。最开始做的时候特别难,整个行业里了解协议的人不多,知道智能体为什么需要协议的人就更少了,要把这个逻辑讲清楚需要很长链路,不一定所有人都能听懂。

2025-12-24 12:36:18 1017

原创 报名丨智源2026十大趋势发布会,获取你的2026年AI发展路线图

当 2025 的时钟走向终点,AI 的下一段旅程已蓄势待发。1 月 8 日,让我们与智源研究院一起,在趋势中看见机遇,在共识中凝聚力量。毕竟,真正的先行者,这种迅猛发展既带来了效率跃升与模式创新,也伴随着技术路线的多元分化、应用落地的复杂挑战与安全治理的迫切需求。从实验室的算法迭代到千行百业的生态重构,AI 已经深入生产生活的每个角落,成为驱动经济社会变革的。每一次范式突破、每一次技术融合,都在催生新的产业图景与未来的可能性。,提炼真正决定未来的关键趋势,锚定2026年AI发展的核心坐标。

2025-12-23 12:44:44 636

原创 当数据见顶,AI的下一次跃迁靠什么?南洋理工刘子纬给出“第二条增长曲线”丨智源专访

真正的世界模型应当揭示世界的运作规律,这包含三个层面:一是内在因果规律,二是智能体与世界的交互,三是智能体之间的交互。从早期提出影响广泛的CelebA、DeepFashion等数据集,到在长尾学习、提示学习、三维视觉等领域确立起新的技术范式,再到如今致力于推动动态世界模型与多模态深度融合——刘子纬的研究始终贯穿着一条清晰的脉络:以问题本质为起点,以范式创新为驱动,在学术与工业的交汇处拓展人工智能的边界。第三,探索社会智能,理解多智能体间的交互与合作,以及人和智能体的交互。这里的界面指用户接入的入口。

2025-12-18 12:04:16 448

转载 CAAI 2025 社会计算青年科学家大会在京举行

下午,大会围绕社会计算的不同研究取向设置了三个分组讨论环节,并由评估专家对各组成果进行了集中点评,系统呈现了社会计算在理论构建、技术反思与现实应用层面的多维进展。聚焦社会计算前沿问题,汇聚来自人工智能、计算社会科学、心理学与社会科学等领域的专家学者与青年科研人员,围绕社会计算的理论基础、方法体系与现实应用展开深入交流。从政治传播与认知视角出发,分析深度伪造政治视频的视觉叙事与情绪认知特征,指出相关内容在意识形态表达和呈现形式上的独特性,可能模糊受众对信息真实性的判断;,以增强理论框架的解释力与区分度。

2025-12-18 12:04:16 72

转载 NeurIPS 2025最佳论文,一作阿里通义千问邱子涵分享

此外团队还进一步发现了门控机制能消除注意力池(Attention Sink)和巨量激活(Massive Activation)等现象,提高模型的训练稳定性,极大程度减少了训练过程中的损失波动(loss spike)。团队在各个尺寸、架构、训练数据规模上验证了方法的有效性,并最终成功运用到了 Qwen3-Next 模型中。已在 NeurIPS、ICLR、ACL、EMNLP、NAACL 等会议发表十余篇论文,其中一作论文荣获 NeurIPS 2025 最佳论文奖和 NAACL 2024 杰出论文奖。

2025-12-15 11:57:11 338

原创 2026年见分晓!自变量王潜揭秘具身智能唯一破局之路丨智源专访

我原本就从事机器人领域的研究,当时便想,或许接下来可以继续深耕机器人领域,机器人行业等待了数十年的金钥匙,其实已经摆在我们面前,那就是如今语言模型所采用的这套方法论,于是便考虑继续投身这一事业。我当时认为,机器人领域此前一直受数据数量问题制约,这与如今我们所说的数据制约还不相同——以前行业内仍以纯粹的强化学习为主,而强化学习面临的问题是,随着任务难度不断提升,每个任务所需的数据量呈指数级增长,从理论上讲,我们或许无法沿着这条路一直推进到真正意义上的通用人工智能,或是物理世界的通用人工智能。

2025-12-10 12:02:00 675

转载 中国具身全明星,2025具身智能年终展望| 记智源具身OpenDay

2025年已经渐进尾声,具身智能的浪潮正从技术创新的实验室,涌向产业落地的深水区。数据闭环和世界模型不再是论文里的名词,而是决定一个机器人能否在真实物理世界中“活”下来的核心。泡沫在退去,价值在沉淀,2025年是具身智能告别“炫技”,真正开始“做事”的一年。为看清前路、凝聚共识,11月20日的智源具身OpenDay汇聚了来自学界、产业界与投资界的顶尖头脑,围绕“模型、硬件、产业”三大核心战场,展开了一场深入而务实的思辨。智源研究院最新发布的Emu3.5世界模型,通过海量视频数据学习,将多模态理解与生成的边界

2025-11-24 18:02:02 179

转载 社区福利|与30+位创始人共聚智源具身OpenDay

本次活动汇聚银河通用、智元机器人、星海图、加速进化、自变量、星源智、原力灵机、因时机器人、松灵机器人、北京人形机器人创新中心、无界动力等40余家前沿团队及智源的合作伙伴们,将集中展示人形机器人及产业融合创新成果。中国联通、中国移动、优必选、海信、软通天擎、招商局集团等领军企业的深度参与,更彰显具身智能驱动实体经济的巨大潜力。罗剑岚 | 智元机器人合伙人、首席科学家,上海创智学院导师。王 鹤丨北京大学助理教授,银河通用创始人及首席技术官。OpenDay,与具身生态同行,与未来交手。

2025-11-19 14:01:16 184

转载 会议通知|CAAI社会计算青年科学家大会(CAAI SCYS2025)即将在北京智源研究院举办

国务院《关于深入实施“人工智能+”行动的意见》明确提出“创新哲学社会科学研究方法”、“超常规构建领军人才培养新模式”、“给予青年人才更大施展空间”等指导,鼓励广大科研人员勇闯人工智能“无人区”。”即将在北京智源人工智能研究院(智源大厦)举行,汇聚社会计算交叉学科领域青年领军人才力量,聚焦社会计算领域的十大关键科学问题,围绕“韧性智能社会”的核心要素与人才体系建设展开深入研讨。发布《社会计算青年战略研究报告》,邀请人工智能领域资深专家分享,为青年学者拓展技术洞察力、社会感知力,提升战略视野。

2025-11-19 14:01:16 126

转载 智能是什么?AGI溯源,重读所罗门诺夫丨品读经典第1期

关于智能是什么的话题,也逐渐有了更多讨论。有人说智能就是压缩,也有人说智能就是学习,还有人说 LLM 不能产生 AGI。然而,所有这些观点,都能追溯到一个统一的源头,那就是柯尔莫哥洛夫复杂度,以及所罗门诺夫归纳。在当前这个时间点,回顾所罗门诺夫的经典工作正当其时。我们仔细探寻,会发现其中蕴涵了丰富的宝藏——从压缩与智能的关系,到强化学习、正则化技巧,乃至持续学习,都能从这些经典工作之中汲取灵感。本期「里程碑论文共读」阅读「所罗门诺夫的经典工作。

2025-11-04 18:22:18 116

原创 哈佛Yilun Du专访:世界模型三问 —— 因果、规划与泛化的征途丨智源独家

比如 Marvin Minsky 撰写的《Steps Towards Artificial Intelligence》,若你细细品读便会发现,如今学界研究的几乎每一个方向,文中都曾提及 —— 他不仅探讨了神经网络的学习方法,还阐述了强化学习、搜索规划的实现路径,以及记忆机制的构建思路。这正是能量基模型的优势所在,即可以通过控制采样时间,提升生成结果的质量。那时候80%的人在做强化学习,20%的人在做各种深度生成模型,比如语言模型或者我们当时在做的能量基模型,和现在的OpenAI很不一样,规模真的很小。

2025-11-03 12:01:33 793

转载 全球 PyTorch 大会与 Triton 大会揭示:算子语言繁荣和分化背后,编译器日益核心

之前,我们关注的是底层 AI 芯片生态(“南向生态”)的割裂问题,因此 FlagOS 社区基于 Triton 编译器技术,打造了更为强大的 FlagTree 编译器,使得广大 Triton 开发者的算法可以通过 FlagTree 运行在多种 AI 芯片上(超过20种),逐步解决了底层芯片后端生态的分裂问题。Gluon 是由 OpenAI 团队开发的更低层级的领域特定语言(DSL),为高级开发者提供更细粒度操作硬件特性的方式,在保持易用性的同时,极致挖掘硬件性能。

2025-10-31 14:51:19 237

转载 智源TALK|ICCV2025最佳论文「马尔奖」从文本生成物理稳定且可搭建的积木结构

随后,我们提出了一个端到端的文本到3D生成流程,能够同时生成3D资产的几何与纹理。在几何生成方面,我们提出了一种基于八叉树的自适应标记方案,它能根据形状复杂度分配表示能力,从而实现更高保真度且更高效的3D形状重建与生成。在外观建模方面,我们利用数据与扩散模型先验,通过文本输入在网格上生成可重新打光的纹理,确保生成的3D对象能在下游生产流程中直接使用。最后,为了使数字设计与现实世界接轨,我们引入了BrickGPT,它融合了制造与物理约束,能够根据文本提示生成物理结构稳定且可实际搭建的积木结构。

2025-10-29 12:41:27 151

转载 青源会首尔话具身前沿,携手清华AIR实验室共筑对话桥梁

此次闭门派对便依托这一学术平台,汇聚来自美国、英国、德国、瑞士、新加坡、中国香港等地的 50 余位学者,大家围绕具身智能和机器人领域前沿技术发展与未来趋势,结合 CoRL 大会期间的所见所感展开深度交流——既分享技术突破、探讨科研转化路径,也在思想碰撞中凝聚行业发展共识,注入新思路。来自美国顶尖科技公司专家、中国香港知名学府科研带头人、明星创企创始人等,纷纷结合 CoRL 大会的参会经历,分享各自关注的前沿学术动态、印象深刻的技术成果,围绕当前热点议题展开热烈探讨,现场观点交锋不断,屡屡迸发新的思考火花。

2025-10-13 12:15:45 133

转载 智源TALK|懂人心才叫真智能,“知人者智”:以用户为中心的智能体交互与训练

钱成,伊利诺伊大学香槟分校 (UIUC) 二年级博士生,导师为季姮教授。曾在 ACL,EMNLP,COLM,COLING,NAACL,ICLR 等多个学术会议发表论文十余篇,一作及共一论文十余篇,谷歌学术引用超 1000,现担任 ACL, EMNLP Area Chair,以及 AAAI,EMNLP,Neurips,COLM 等多个会议 Reviewer。UserBench 最标志性的设计,是旅行规划任务,覆盖五个子场景,每个场景都设有数十条隐式偏好表述,例如“行程很紧”就暗含“直飞/少中转”的飞行偏好。

2025-10-13 12:15:45 175

转载 智源TALK|清华RL最新报告114页,如何将算力更高效地转化为推理智能

从基于人类反馈的强化学习(RLHF)到可验证奖励的强化学习(RLVR),RL 不断推动大语言模型从单纯的指令遵循迈向深度推理,即演进为大型推理模型(LRMs)。本报告将围绕我们最新发布的大模型推理能力强化学习综述,详细阐述 RL for LRMs 的基础框架、前沿问题、训练资源与应用场景,以及未来面临的挑战。我们特别关注大模型与环境在长期进化过程中的交互与学习机制,希望为“如何将算力更高效地转化为推理智能”这一本质问题,带来新的思考与启发。👆扫码报名👆或者点击「阅读原文」报名。

2025-10-13 12:15:45 176

转载 推动具身智能走出实验室,具身大模型挑战赛火热报名中!

这里不仅是比拼模型实力的竞技场,更是展示创意与才华的舞台。让我们一起突破边界,提升模型能力,推动具身智能。2025 第二届中关村具身智能机器人应用大赛。走出实验室,走进现实世界,创造真正的价值!智源具身智能模型能力挑战赛火热报名中!「具身引智 · 应用未来」汇聚尖端技术与产业应用。欢迎大家踊跃报名参赛!未来已来,等你出发!

2025-09-29 12:36:17 140

转载 2025智源学者资助计划启动

人工智能是新一轮科技革命的核心力量,像水、电力一样,产生的智力逐步基础设施化,推动着千行百业产生深刻的变革。他们在人工智能数理基础、认知神经基础、机器学习、自然语言处理、信息检索与挖掘、智能系统架构等关键方向不断突破,持续拓展着世界人工智能的科研版图。这里,还孕育出一批具有原始创新能力的人工智能企业,释放出澎湃的创新力量。,如多模态模型、世界模型、具身大脑、下一代类脑框架、AI安全、AI与科学技术工程等领域的交叉创新;优质算力支持,高质量数据集,自研开源算法体系,工程框架平台,专业科研设备。

2025-09-23 15:41:17 211

原创 线下活动报名|智源具身智能新基建Workshop

地点:智源大厦一层报告厅(北京市海淀区成府路150号)9月24日(周三)下午,北京智源人工智能研究院将举办。时间:2025年9月24日 14:00-17:30。,带您了解智源具身智能领域最新的工作进展。欢迎扫码报名,共同探索具身智能的未来!具身智能新基建Workshop。

2025-09-16 12:02:06 473

原创 专访澳洲院士Toby Walsh:AI 终将领跑数学与科学,但人类艺术创造力难以替代丨智源独家

在他看来,艺术创造力的核心在于 “人类处境”—— 坠入爱河的甜蜜、失去挚爱的痛苦、对生死永恒的思考,这些人类独有的真实体验,是 AI 永远无法拥有的。我觉得这是 AI 系统带来的一个全新伦理挑战,因为 AI 可能具有显著的自主性,能在有限或没有人类监督的情况下做决策,像自动驾驶汽车、自主武器。我认为这一点是非常重要的,作为学术上的建议,不仅适用于当下的 AI 领域,也适用于任何年轻人的学术生涯,那就是你要确保自己在某一方面是有名的。我也意识到,作为一名科学家,向公众传递相关信息,参与这场讨论,至关重要。

2025-09-16 12:02:06 997

转载 智源研究院携手联合国、GOSIM共同举办“可持续发展大会”,凝聚全球开源力量共探AI普惠全球

Mehdi Snene 博士是联合国秘书长数字与新兴技术特使的高级顾问,也是联合国数字与新兴技术办公室的成员,负责领导人工智能能力建设、数字公共基础设施和新兴技术的全球倡议。大会的一大特色是“展示与分享”(Show & Tell)环节,将重点介绍已经为联合国可持续发展目标做出贡献的实际用例和开源项目,将对话转化为切实参与的灵感。涵盖了人类社会发展的方方面面,从消除贫困与饥饿,到应对气候行动、实现和平与正义。发起一个项目,促进开放数据的获取和使用,从而实现基于证据的创新与协作,以推动可持续发展目标的实现。

2025-09-11 15:03:54 194

原创 青源会香江谱新章:香港青源会成立,链接全球资源推动 AI 科研转化

面向未来,香港青源会将结合香港的优势领域,聚焦科研成果的应用与转化,链接全球人工智能青年人才,为学者提供从科研创新到成果落地的全周期支持。他指出,在智能时代到来的历史性机遇下,希望香港青源会能成为青年学者分享创新、链接资源、共做大事的平台,推动产出具有世界影响力的成果。此次香港青源会成立,既为全球 AI 青年学者搭建了交流合作平台,也将助力香港成为 AI 领域学术创新与产业转化枢纽,未来有望成为推动 AI 跨地域、跨学科协作的重要力量,为人类智能时代贡献青年智慧。当日下午,香港青源会接续开展了特别活动。

2025-09-09 12:01:08 511

转载 活动报名|无需任何标注数据,大模型也可自我提升,腾讯R-Zero,利用大模型自我奖励的强化学习训练来实现自我演进

在这一框架中,首先从一个基础 LLM 出发,初始化两个具有不同角色的独立模型:一个是挑战者 (Challenger),另一个是解答者 (Solver)。这两个模型分别独立优化,并通过交互共同进化:挑战者的奖励来自于提出接近解答者能力边界的任务,而解答者的奖励则来自于不断解决挑战者提出的更具挑战性的任务。然而,现有的自演进训练方法仍然严重依赖于大量人工整理的任务和标注 (human annotation),通常通过微调或强化学习来实现,这就成为推动 AI 系统超越人类智能能力的一大根本瓶颈。

2025-09-09 12:01:08 161

原创 从清华园到青海湖:系统研究「真爱」之路丨翟季冬专访

这需要它能感知底层芯片的特点,比如针对某一款特定的 AI 芯片,它有哪些硬件功能,编译器在转换代码时就需要有效利用这些硬件功能,才能充分发挥底层硬件的性能。清程极智目前提供的大模型端到端的训练和推理及配套的性能优化服务,已帮助数款大模型实现了在国产芯片上的快速预训练和高性能推理优化,全面降低了大模型的部署成本,极大提升了大模型的运行效率。智源专访栏目意在展现行业顶尖技术研究者和创业者的研究经历和故事,记录技术世界的嬗变,激发当代AI从业者的创新思维,启迪认知、关注突破性进展,为行业注入灵感光芒。

2025-08-20 12:03:38 960

转载 GPT-5将上线,OpenAI 这份“作业”合格吗?| 青源Workshop第33期

据报道,此次升级打破传统单一模型格局,通过整合 o‑series(如 o3)推理模型和 GPT‑4o 的多模态能力,构建首个“全任务引擎”——用户无需在文本、代码、图像与工具调用间切换,即可实现对话、推理、执行的一站式体验。微软 Copilot 的智能模式已率先接入 GPT-5,可以根据任务复杂度动态切换“快速-深度”双思考模式。织「GPT-5 上线,OpenAI 交作业」线上 workshop ,邀请领域内多位专家与研究者,共同探讨 GPT-5 的无限可能。8月8日(本周五),下午3。

2025-08-07 14:31:18 182

转载 智源TALK | 连续思维链为何更强?Russell学生最新工作

我们证明,一个两层transformer可以通过 D 步连续 CoT 解决有向图可达性问题,其中 D 是图的直径,而目前已知的关于采用离散 CoT 的常数层 Transformer的最优结果则需消耗 O(n^2) 的步数(n 为顶点数量,且 D < n)。然而,尽管已有研究从理论上证明离散 CoT 技术能提升模型能力,针对连续思维链(continuous CoT)在一些复杂推理任务(如有向图可达性)上的优越性仍缺乏理论理解。他本科毕业于清华大学姚班。基于叠加态的推理:一个关于连续思维链的理论视角。

2025-07-31 12:01:27 126

转载 对话Meta杨凯峪:给 AI 打钢印的人丨独家专访

我通过和他联系,得到去密歇根大学实验室实习一个暑假的机会,主要研究计算机视觉,这也是他的研究方向。博士期间,我的研究方向也在不断调整,从最早的计算机视觉到后续工作,一路走来经历了不少变化,也收获了很多宝贵经验。即使彼此不在同一个团队,也不存在上下级关系,只要我们对同一个问题感兴趣,就能一起去做,然后把成果展示出来,也会得到认可。专访栏目意在展现行业顶尖技术研究者和创业者的研究经历和故事,记录技术世界的嬗变,激发当代AI从业者的创新思维,启迪认知、关注突破性进展,为行业注入灵感光芒。本次专访为总第28期。

2025-07-22 12:02:44 304

原创 北大贺笛:研究是条河,我们需驭浪前行丨智源独家

智源专访栏目意在展现行业顶尖技术研究者和创业者的研究经历和故事,记录技术世界的嬗变,激发当代AI从业者的创新思维,启迪认知、关注突破性进展,为行业注入灵感光芒。篇,但因为此前积累的阅读基础,再看新一年的论文时,很容易判断新论文的来源。我见过的发展最好的学生,都是那些能走在导师前面的;贺笛的研究经历充分证明:研究如奔涌不息的长河,唯有锁定真问题、躬身实践的人,才能在学术浪潮中勇立潮头。换句话说就是,你永远看的是当前的研究方向最重要的东西是什么,然后跟着最前面的那些水滴一起往前冲就可以了,我觉得是这个样子。

2025-07-14 12:01:32 463

转载 智源TALK丨Lumina 具身智能社区联合创始人分享,周四直播

因此我们提出了 RoboTwin 2.0,提供基于多模态大模型与仿真在环的自动化专家代码合成方案,开源了含 731 个,147 类带丰富标注物体的 RoboTwin 物体数据集(RoboTwin-OD),并基于两者构建了支持 5 款本体与 50 个任务的大规模域随机化仿真双臂操作数据合成器与评测基准集。双臂机器人在协同装配、工具使用和物体交接等复杂场景中具有重要作用,但要训练出通用的 VLA 等操作策略,现有数据收集和仿真管线面临多重瓶颈。另一方面,现有仿真缺乏针对新任务的高效、可扩展的专家数据生成方法;

2025-07-14 12:01:32 194

原创 斩获最佳论文后,他没有All In自动驾驶,而是All In了具身智能!| 专访 CVPR 最佳·李弘扬

在深入思考与调研后,我逐渐意识到,具身智能在其四大核心要素:算法、数据、硬件与应用场景的每一个层面都蕴藏着巨大的研究价值和应用潜力。这并非一次简单的“转型”,而是一场深思熟虑后的“升维”,是将一套业已成熟的“感知-决策-执行”闭环框架,向更通用、更复杂的物理世界进行的自然延展。虽然我个人确实减少了对许多媒体账号的关注,但来自朋友,尤其是投资圈朋友的信息分享,有时也难以避免。不过,从另一个角度看,这或许是件好事。如,只要模型更大、数据更多、计算更强,语言模型的表现就会越来越好,而且提升是稳定的、可预期的。

2025-07-07 12:30:24 1116

转载 智能体丨Sakana AI & 英属哥伦比亚大学,达尔文哥德尔机

然而,在复杂的现实世界应用中,由这些语言模型驱动的智能体系统往往表现不如普通领域专家。在本次报告中将介绍一个新兴研究方向智能体自动化设计 (Automated Design of Agentic Systems, ADAS),重点介绍首批描述该领域的工作之一ADAS(https://www.shengranhu.com/ADAS/),以及我们近期基于ADAS,探索通过修改自己代码、实现递归式自改进的达尔文哥德尔机(Darwin Gödel Machine, https://sakana.ai/dgm/)。

2025-07-07 12:30:24 208

原创 智源大会AI安全论坛:深挖风险红线,探讨应对措施

因为每个公司我们都讨论到,安全是非常重要的,但由于竞争问题,所有的公司可能在目前的安全问上没有做出足够的努力。我认为这将是未来的趋势,正如昨天说的 Yoshua Benjio也创建了自己的AI安全公司,在Real AI我们也在做类似的事情。在您最近的实验的AI控制报告中,您使用了被信任的GPT-3.5 来监控和不被信任的GPT-4来生成代码。段雅文:王希廷老师,您是大数据模型的神经科学领域的专家,您在最近的研究中安全概念上的启动因素揭露了通过可传输的提示和输入,对齐的模型甚至都可以被系统性地操纵。

2025-06-30 14:34:16 1398

原创 自主智能体——迈向通用智能的必由之路丨智能体论坛精华集锦

在长链路调优中,团队采用后向对齐的方式,将多智能体组成的链路视为齿轮系统,通过固定后面的系统,调优前面的系统,实现多轮优化,显著提升了系统性能。智能体的认知结构由一些不同的核心内在状态组成,这些内在状态包括世界模型等用于根据当前状态预测未来的技术模块、用来存取过往经验的记忆模块、驱动智能体的目标模块、表征即时状态的情绪模块、以及综合长短期目标和当前状况来给予反馈的奖励模块等。与传统在线教育相比,该平台利用大模型和多智能体技术,以更低的成本和更少的时间构建自适应课程,并为每个学习者提供智能体陪伴学习。

2025-06-26 12:02:41 972

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除