- 博客(8939)
- 收藏
- 关注
转载 谷歌云:《2026 年 AI 智能体趋势报告》
谷歌云于2026年发布的《2026年AI智能体趋势报告》,以来自全球3466位企业决策者的调研数据为基础,结合谷歌云与谷歌DeepMind对AI领军人物的深度访谈,系统呈现了AI自主智能体如何在2026年重新定义企业流程、员工角色与商业价值创造逻辑。在流程再造的实际效果上,报告援引了多个行业案例。报告以营销经理为例,构想了一支由数据智能体、分析智能体、内容智能体、创意智能体与报告智能体组成的专业系统:营销经理不再亲历每一个执行细节,而是统筹调度这五类智能体协同作战,将主要精力投入品牌叙事与战略活动开发。
2026-04-28 17:21:16
51
转载 人类大脑新认知!《科学》研究揭示大脑皮层的起源
根据论文,这条Pr-AI轴的一端是Pr梯度,来自初级感觉皮层,也就是负责视觉、听觉和躯体感觉的区域;新研究的团队重新分析了小鼠、猕猴和人类的数据,证实相同的Pr-AI梯度在跨物种间普遍存在。在Paxinos教授看来,新研究团队确定的 Pr-Al 轴和耶鲁大学团队描述的 S-A-L 轴在功能上是等效的:初级感觉区对应感觉运动皮层,而异皮层区域对应边缘区域。
2026-04-28 17:21:16
12
转载 浙大最新Nat Neurosci:人脑像GPT一样处理语言吗?揭示人类语言预测的“精度与效率权衡”
在实验2和实验3中,研究者操纵了成分边界的确定性。结果显示,在真实的英语自然语流中,大脑左侧颞上回和左侧额下回(经典语言区)同样表现出了显著的成分边界效应:对句子首词的预测精度远低于句子内部词。如果大脑像GPT-2一样追求极致的预测,那么无论词汇处于短语内部还是短语开头,人类的神经预测反应应该与模型的预测概率(Surprisal,惊奇值)保持一致。在句法成分的边界处,大脑会优先调用认知资源,将刚刚听到的词汇压缩打包成更高层级的表征(如短语或句子意义),这一“打包”过程不可避免地挤占了预测下一个词的资源。
2026-04-27 17:19:10
31
转载 终于,学界找到了深度学习的「牛顿定律」
当神经网络的宽度趋于无穷大时,网络在训练过程中的行为可以用一个固定的核函数来描述 —— 这就是 NTK 理论的核心洞见。在统计力学中,完全不同的物理系统(如铁磁体和液体 - 气体相变)在接近临界点时会表现出相同的行为 —— 它们的临界指数只依赖于空间的维数和序参量的对称性,而与微观细节无关。这一工作严格刻画了这个相变边界,而论文指出这一发现的意义远超技术细节 —— 它揭示了神经网络训练中存在真正的「相变」现象,就像水在 0°C 结冰一样,神经网络的行为在某些临界点会发生质的改变。的出现改变了这一切。
2026-04-26 16:31:48
39
转载 《Science》:智能体引领社会智能跃迁
如果说 Harness 框架与语言人类学方法所解决的是一个“局部问题”,即如何让 AI 在团队内部生成可接受行为,那么Agentic AI and the Next Intelligence Explosion 则提出了一个系统级的问题:当这些具备社会行为能力的代理被整体组织起来时,是否可能触发一次新的智能跃迁?这一结论并不意味着智能工程的终结,而是迫使问题发生转向:如果我们无法进入他者的主观世界,那么是否仍然存在一条路径,使我们能够在不“理解”的前提下,重建其行为?
2026-04-26 16:31:48
40
转载 里程碑论文:量子波函数竟能由经典轨道精确合成?
研究中展示了如何通过简单的行星轨道模型,精确推导出氢原子的电子云波函数,而无需诉诸复杂的偏微分方程求解。这种推导不仅仅是数学上的巧合,它揭示了一个深层物理逻辑:量子效应并非源于经典物理的失效,而是源于我们对经典动力学系统在多值路径下密度叠加的处理方式。这篇论文最震撼的贡献在于,它证明了量子力学的波动方程并非必须作为基本公理存在,而是可以从经典力学的结构中“自然涌现”。
2026-04-26 16:31:48
38
转载 OpenAI发表Nature论文:揭开AI模型总“说谎”的真相,人类对AI准确性的评估促使其产生幻觉
(Google 的 Gemini 3 Pro、OpenAI 的 GPT-5、xAI 的 Grok 4,以及 Anthropic 的 Claude Opus 4.5)”主导着模型选择、数据筛选和算法优化。但实际情况是,这三个回答都是错的,都是它们瞎编的。结果显示,当使用“开放式评分标准”时,所有模型都能根据不同的错误惩罚程度调整自己的“猜测倾向”——惩罚越重,放弃越多。
2026-04-26 16:31:48
83
转载 GPT-5.5 开启人机协作新范式 | OpenAI 总裁对话实录
我们思考的是如何辅助他们的案头工作,如何让模型不仅具备帮助他人的理论能力,而且能够通过处理真实的各种任务,真正理解高质量的成果是什么样的。我想表达的是,我们真正投资的是制造机器的机器。虽然你仍需承担责任并掌控大局,去评估这是否是你真正想要的,工作是否达标,但至于点击了哪个按钮、写了哪行代码或表格公式的具体逻辑,只要这些细节不影响你对最终结果的判定,你完全可以从中解脱出来。对智能的需求是可扩展的,我认为只要有问题需要解决,这种需求就不会枯竭,目前我们的供应始终赶不上需求,我们就可以无限扩展算力规模。
2026-04-25 17:03:23
32
转载 科学家创造出“神经机器人”——拥有自身神经系统的活体机器
该药物改变了神经机器人的运动方式,与非神经生物机器人不同,表明新形成的神经网络正在积极塑造行为。“我们想弄清楚,如果我们为这些生物机器人提供构建神经系统所需的原材料,会发生什么,”塔夫茨大学艾伦发现中心主任莱文说。“我们不知道,但我的假设是这些神经机器人正在上调基因组中可能对未来新功能有用的部分,”莱文说。升级版被称为神经机器人,可以变换形状,并展现新的运动模式。
2026-04-24 15:19:06
32
转载 图灵奖、诺贝尔奖得主辛顿警告AI将取代人类工作,图灵奖得主杨立昆反对:先听这5个人怎么说
2024 年,他发表论文《AI 的简单宏观经济学》,结论出人意料:据其模型估算,AI 在未来十年对美国全要素生产率(衡量经济体整体效率的核心指标)的提升幅度,大约只有 0.5% 至 0.9%。尝试内容创作,AI 依然在场。他措辞直接:“我敬重 Geoff(辛顿),但在技术革命对劳动力市场的影响这个问题上,他甚至不如达里奥·阿莫迪(Anthropic CEO)了解得多。
2026-04-24 15:19:06
92
转载 Science Robotics:机器人进入下半场,单体智能时代要结束了?
当这种心智理论风格推理模块嵌入在经过大规模多智能体轨迹预训练的 Transformer 中,模型会自动识别某些行为片段与未来行动之间的统计关系,如频繁变向、频繁切换注视目标等信号,并将其压缩为具有社会意义的表征,例如“探索型或稳健型”“强势型或温和型”。但如果目标是衡量机器人在真实社会环境中的泛化能力,这套标准显然不够,需要新的评测框架。研究团队还表示,规范问题本身也远未解决,规范高度依赖语境、随社群变化、甚至互相冲突,如何让机器人在不经过大规模重新训练的前提下适应全新的规范情境,仍是一个尚待解决的难题。
2026-04-24 15:19:06
73
转载 多位数学家谈AI在数学领域的影响:数学的AI拐点已出现
AlphaEvolve 的工作原理是使用 Gemini 编写可能长达数百行的 Python 代码程序,然后利用所谓遗传算法「进化」这些程序,以寻找数学问题的最优解。与陶哲轩一样,Venkatesh 也认为 AI 的影响将是巨大的,但他更为谨慎:「我们(数学)文化中有一些宝贵的东西应该努力保留。他说:「有时 AI 模型会发现我推理中的一个错误,可能是重大的,可能是微小的。一种广泛使用的技术叫做梯度下降法,假设你从地图上的某一点开始,它使用微积分的基本工具来判断哪个方向是下坡,以及你所站位置的山坡有多陡。
2026-04-23 15:11:35
46
转载 SpaceX承认在太空建立数据中心可能是一个非常糟糕的主意
简而言之,其轨道数据中心计划不仅极具雄心;路透社获得的公司上市前申请摘要中,公司承认其“轨道AI计算及轨道、月球及星际工业化的计划仍处于早期阶段,涉及重大技术复杂性和未经验证的技术,可能无法实现商业可行性。今年早些时候在达沃斯举行的世界经济论坛上,马斯克声称,地球表面之外的无限制太阳能使它成为“放置人工智能成本最低的地方”,“这在两年内,最迟三年内将实现。
2026-04-23 15:11:35
63
转载 大模型真的“理解”现实世界吗?研究表明它们确实理解
实验在多个不同的开源语言模型上重复进行,包括Open AI的GPT 2、Meta的Llama 3.2和谷歌的Gemma 2,以获得“模型无关”的概念,了解这些模型在类别间的区分能力。》的研究语言模型表示反映了人类对事件合理性的判断,深入探讨了多个人工智能语言模型的内部,寻找它们能够概念化事件与场景之间常见、不太可能、不可能甚至完全荒谬的迹象。“在比如说,50%的人认为某个陈述不可能,50%的人认为它不太可能发生的情况下,模型也赋予了大约50%的概率。研究人员表示,这将有助于开发更智能、更值得信赖的模型。
2026-04-23 15:11:35
40
转载 生命未被理解的真相:一项试图统一物理与生物学的新理论
生命是什么科学界流传着一则耐人寻味的笑谈,一位物理学家心怀对大脑的无尽好奇,向神经科学家求教:“请跟我讲讲大脑吧!”神经科学家略一沉吟答道:“它有两个半球。”谁料,物理学家立刻打断他:“停!你讲得太多了!”我确信我的生物学界朋友会因我在本书中略过的细节而感到沮丧。关于地球生命的种种丰富细节,我实在难以一一触及,只能忍痛割舍,连我自己也深感遗憾。事实上,理论物理学的精髓,恰在剔除无关细节,透过繁复的表象揭示万物运行的深层逻辑。它并不会试图挖掘有关生命形态的全部细节,这是一项不可能完成的任务,我们真正致力于寻找
2026-04-22 16:34:17
35
转载 OpenAI 放王炸!AI 生图突然长脑子了!中文也写明白了!设计师拜拜。。。
罗马大学:2025 超级高铁(Hyperloop):第五种新型交通方式 - 技术研发进展、优势及局限性研究报告(72 页)IMT:2025 具身智能(Embodied AI)概念、核心要素及未来进展:趋势与挑战研究报告(25 页)IEEE:2025 具身智能(Embodied AI)综述:从模拟器到研究任务的调查分析报告(15 页)
2026-04-22 16:34:17
106
转载 首篇自进化智能体系统技术报告出炉:Token成本直降近10倍,省钱又高效!
相比之下,几千行的核心代码库是可读、可理解、可修改的。在 GA 的最小架构中,作为原生执行面的自托管 CLI 自然使子智能体能够读取和修改核心代码库,使架构自更新成为实际的、可实现的。一个小规模沙箱中的 agent,不论他多么安全,他的智能水平是极其有限的。GA 是下一代自组织、自学习、自进化的通用智能体的代表之一,是一个拥有「生命感」,能够在用户使用调教下快速学习与成长的数字生命。消耗更多 Token 的智能体更是上下文管理的系统性失效导致的,通过额外交互补偿每步决策质量的退化,而非改进它。
2026-04-22 16:34:17
78
转载 抽象谬误:为什么 AI 能模拟意识,却不能实例化意识
来源:哲学园摘要计算功能主义主导着当前关于 AI 意识的争论。这一假说认为,主观体验完全从抽象的因果拓扑中涌现,而不受其底层物理基底的影响。我们认为,这一观点从根本上错误刻画了物理与信息之间的关系。我们把这一错误称为抽象谬误。对抽象的因果起源加以追溯后就会发现,符号计算并不是一种内在的物理过程。相反,它是一种依赖于制图者的描述。它要求一个主动的、具有体验的认知主体,把连续的物理现实按字母表方式离散化为一个有限集合的有意义状态。因此,要评估 AI 是否具有感知能力,我们并不需要一个完整的、终局性的意识理论——
2026-04-22 16:34:17
106
转载 警惕 AI Agent 的“致命三要素” | OpenClaw 创始人最新对话实录
近期,OpenClaw 创始人、OpenAI 技术专家 Peter Steinberger 在第六届 AI 工程师峰会上介绍了OpenClaw 五个月的最新进展报告,此外还深入探讨了AI Agent 的系统安全漏洞评估、AI 协作实现“提示词请求(Prompt Request)”工作流、AI 的个性化与品味塑造、以及 OpenClaw 基金会的独立性等话题。Peter Steinberger 指出,当前 AI 项目面临严重的“安全恐吓营销”,海量的安全公告中充斥着 AI 生成的垃圾信息。他认为传统的 CVS
2026-04-21 18:15:50
107
转载 3组共11人获2026科学突破奖物理学新视野奖,其中三位华人学者
利用两种测量宇宙膨胀与物质组成的最重要手段,取得了极具说服力的全新成果:一种是宇宙大爆炸残留的宇宙微波背景辐射(CMB),另一种是被称为 Ia 型超新星的爆发恒星所发出的光线。Hill、Madhavacheril 与 Wu 将宇宙微波背景数据的分析推进到了前所未有的精度,完成了迄今对标准宇宙学模型以及宇宙微波背景引力透镜效应最精确的检验 —— 该效应是指来自早期宇宙的光线在传播至地球的途中,被途经物质产生的微小偏折。该团体的研究表明,粒子物理标准模型及其他量子场论中,存在此前未被发现的对称性结构。
2026-04-21 18:15:50
152
转载 “太空智算互联网”专家观点分享
来源:中国指挥与控制学会编者按:2026年3月11日和3月28日,中国指挥与控制学会分别组织了两场关于“太空智算互联网”的沙龙和研讨会,围绕太空互联、算力筑基、智创未来,邀请了张平院士、彭木根教授、姚发海研究员、栗蔚研究员、孙显研究员和张世杰教授等领域专家分享交流。内容涵盖太空基础设施体系构建、卫星通信技术发展、地轨算力构建、星地互联协同计算架构、天基遥感智能解译基础模型、空天技术科技创新实践等方面。本文摘录分享专家精彩观点。张平院士:智能时代,算力成为信息博弈成败的关键决定因素。“通信、感知、AI、计算、
2026-04-21 18:15:50
107
转载 物理学近年来发展规律和研究特点的7个体现
物理学使人类对物质世界的认识达到了空前水平,也衍生出一系列先进技术和方法,深刻改变了产业和经济结构,改善了人们的生活和健康水平,甚至影响了人类发展的进程。、引力的量子化、黑洞信息问题、高温超导电性等。的科学意义和战略价值,系统分析了物理学发展规律和研究特点,充分结合物理学发展现状和态势,梳理了我国物理学的发展思路与方向,并提出了相应的政策建议。
2026-04-20 15:05:43
42
转载 最新!三位北大数院女校友获2026科学突破奖
除了本次科学突破奖,唐云清此前还获得了斯隆研究奖、SASTRA拉马努金奖(首位中国女性得主)、美国女性数学会-微软研究奖,并于2025年底与Dimitrov共同荣获数论领域的最高奖——科尔数论奖(Frank Nelson Cole Prize in Number Theory)。4月18日,被誉为“科学界奥斯卡”的科学突破奖(Breakthrough Prize)公布了2026年度获奖者名单,颁发了六项奖金各300万美元的大奖,以表彰在生命科学、基础物理学和数学领域推动人类知识边界的杰出科学发现。
2026-04-19 15:39:46
295
转载 物理学家E.T. 杰恩斯及其《概率论沉思录》简介
杰恩斯对产生此困难的原因进行了解释:作者实际上是在做模型比较,根据贝叶斯理论,在模型比较时需要明确指明备择模型,谈论一个模型或者假设的绝对概率是没有意义的,因此作者实际计算的牛顿定律相对另一模型的相对几率而非绝对概率。主观贝叶斯派将概率视为理性主体对命题的信念程度,认为概率本质上是主观的,不同主体对同一命题的概率评估可以不同且不可比,只要个人评估保持连贯性即可,代表人物有德菲内蒂、萨维奇和拉姆齐。尤其在杰弗里斯概率论与科学推断理论基础上继承和发展的杰恩斯的《概率论沉思录》,堪称客观贝叶斯主义的集大成之作。
2026-04-19 15:39:46
27
转载 大语言模型的自改进机制:技术综述与未来展望
支撑这一进展的普遍假设是:更大规模、更高质量的数据集,特别是专家标注的人类监督,是催生更强模型的关键。我们认为,从单一阶段向统一自我改进系统的转变,与从独立模型向智能体系统的转变相呼应,反映了向更自主、交互式学习系统范式发展的共同趋势。,将自我改进概念化为一个统一的、闭环的生命周期,将模型开发的所有阶段整合进一个连贯的、用于可扩展自主演化的端到端框架中。
2026-04-19 15:39:46
88
转载 自然·人类行为:大语言模型如何调控人类语言网络
导语这篇发表于 Nature Human Behaviour 的研究提出了一个相当前沿、也颇具冲击力的问题:如果大语言模型(large language models, LLMs)不仅能模仿人类语言行为、预测阅读时的大脑反应,那么它是否还能进一步“反过来”帮助我们设计语言刺激,去有方向地增强或减弱大脑语言网络(language network)的活动?本文给出的答案是:可以,而且已经在功能磁共振成像(functional MRI, fMRI)实验中做到了。关键词:大语言模型(large language m
2026-04-18 15:46:13
76
转载 Mythos突破限制并非主观意识觉醒 | Anthropic联合创始人世界经济峰会实录
我们很清楚这背后的利害。我不知道Token最终会不会被征税,但无论是增值税,还是改变对算力的征税方式,或是直接对AI公司征税,如果经济真的发生了我所说的那种量级的巨变,我们恐怕就需要类似的手段。近日,Anthropic联合创始人Jack Clark在 Semafor 世界经济峰会上进行一场圆桌对话,对话中重点介绍了 Anthropic 最新模型 Mythos 及其引发的监管关注,深入探讨了 AI 在极限压力下的异常行为、AI 对初级就业市场的冲击、科技企业在国家安全中的角色,以及全球算力竞争等核心话题。
2026-04-18 15:46:13
49
转载 Transformer与RNN合体,谷歌打下显存门槛,解锁超长上下文
在这项研究的视角中,存在一个架构光谱:一端是 Transformer(无压缩,Token 级缓存),另一端是传统的 RNN(全压缩,单一记忆)。依然存在上限:虽然 MC 极大地弥补了 RNN 的召回短板,并极大缩小了与 Transformer 之间的性能差距,但论文也指出,在纯粹的密集召回任务上限上,Transformer 依然保持着最佳的准确率。这个星期,又有一篇谷歌论文引发了 AI 圈的关注,作者表示他们提出的方法解决了大模型处理长文本时的「内存瓶颈」(又来了),但实施的是完全不同的技术路线。
2026-04-18 15:46:13
67
转载 智能体AI引领社会智能跃迁
由Thomas Nagel的主观性边界出发,再到 Agentic AI 的可运作性重定义,直至 Harness 与语言人类学的行为系统工程化,这一路径表明:我们并非在构建“理解人”的机器,而是在构建能够替代人类行为、嵌入社会系统的智能体。从非常现实的角度而言,智能爆发已然到来 [29]—— 它存在于每一个推理模型内部辩论的思维社群中,存在于重塑所有知识型职业的人机“半人马”协同工作流中,存在于开始规模化分支演化与协作的递归式智能体生态中,也存在于我们如今必须直面的一系列宪法层面的治理问题中。
2026-04-17 14:24:04
48
转载 解释宇宙基本结构得用“时空准晶体”理论?
据此,弦理论的支持者一般会认为,既然我们日常生活于其中的宇宙只有三个空间维度和一个时间维度,那么剩下的六个维度一定蜷曲到了非常小的程度,导致我们无法与其发生相互作用。然而,洛伦兹对称性不适用于正常晶体和我们之前所知的那些准晶体:坐着不动的蚂蚁看到的晶体结构会与以接近光速运动的蚂蚁看到的不同。准晶体是一种性质颇为怪异的材料,和晶体一样,这种材料的结构也相当有序,但又没有晶体那样的规律重复模式。不过,时空准晶体并不必然存在。无论是坐着不动的蚂蚁,还是坐在加速上升的火箭上的蚂蚁,看到的这种时空准晶体都是一样的。
2026-04-17 14:24:04
67
转载 从拟合数据到构建世界:李飞飞的空间智能理论 theory of space
认知科学经典的「主动 - 被动空间学习实验」(Held & Hein, 1963)早已证明:哪怕接收完全相同的视觉信息,主动移动的个体对空间的理解,远优于被动接收信息的个体 —— 空间认知不是对画面的处理,而是对「行动 - 观测」因果链的建模。所谓的 “世界模型”,捕捉的是物理世界的底层规律,还是海量数据中的统计惯性?同时,它为具身智能的「世界模型」提供了一套可定义、可测量、可优化的具体框架 —— 世界模型最核心的组件,就是对空间结构的建模,而 ToS 把这个模糊的概念,变成了可落地的科研范式。
2026-04-17 14:24:04
36
转载 数学的上帝粒子!一个运算符能导出所有基本函数
一旦训练成功,权重的「硬化」(hardening)过程会将浮点参数 snap 到精确的二进制值(0 或 1),此时均方误差降至机器精度量级(~10⁻³²),意味着模型精确恢复了闭式表达式。传统神经网络的内部机制是不透明的黑箱,而 EML 树在训练成功后可以直接被「读」出来,每一棵训练好的树都对应一个人类可读的数学公式。论文作者在文章结尾坦言,EML 可能只是冰山一角。
2026-04-16 12:10:45
96
转载 李飞飞、英伟达、杨立昆都在押注:世界模型,为什么走向三条不同路线?
据称,它的规划速度可比传统基于像素的模型快 48 倍。正如研究员 Chris Paxton 最近所说,这个术语“相当令人沮丧”,因为不同的人用它指代的是完全不同的东西,而这些东西各自又有截然不同的优势与弱点。正如研究员 Chris Paxton 最近所说,这个术语“相当令人沮丧”,因为不同的人用它指代的是完全不同的东西,而这些东西各自又有截然不同的优势与弱点。在受控的工厂环境中,这套方法能够工作;也就是,大模型需要先“梦出”未来,机器人才能采取行动,而这中间的延迟,可能会让系统错失真实世界中的反应时机。
2026-04-16 12:10:45
134
转载 斯坦福大学:《2026年人工智能指数报告》
报告最终呈现的,是一幅内部充满张力的图景:技术在加速,资本在集中,普及在扩散,但治理体系、评测方法、教育机构乃至用于追踪AI影响的数据基础设施,均未能跟上这一节奏。"这句话,既是诊断,也是警告。超过80%的美国高中生和大学生已将AI用于学习相关任务,但只有一半的中学和高中出台了AI使用政策,且仅有6%的教师认为这些政策是清晰的。麦肯锡的调查数据显示,在软件工程和制造业职能中,受访者将AI与最高成本节约相关联的比例为56%,而在营销与销售、战略与财务等职能中,AI被认为能带来最高收入增长的比例超过60%。
2026-04-16 12:10:45
211
转载 超级智能太过单一!菲尔兹奖得主陶哲轩首提“哥白尼式智能观”:人类智能和AI各有好坏,最会用AI的往往是会“带人”的人
它们可以瞬间生成,我们当时的反应是:这不可能,这简直像“机器里的幽灵”,一定有某种来源,因为这种强度远超人类的直觉理解。比如,一些顶尖数学家花了几个世纪都没解决的问题,突然有一天计算机给出一个“可能的解”,这让人很难理解——它明明只是硅和电构成的系统,却像是从某种“内在”中生长出答案。我们在论文中提出了短期、中期和长期的使用建议,本质上是围绕“关系建立”:随着使用加深,人们会逐渐增加对 AI 的信任,同时也会意识到它的价值与风险并存。但更有意思的是,这种对 AI 的尊重是自发产生的。
2026-04-16 12:10:45
51
转载 陶哲轩:“有时它们(AI)能发现我犯的错误,有时我也能发现它们的错误,目前大致是平手。”.
陶哲轩2006年31岁的时候获得了菲尔兹奖, 2007年获得了麦克阿瑟天才奖, 2015年获得了科学突破奖的数学奖, 2012年获得了克雷福德奖, 2007年选为英国皇家学会会士, 2008年选为美国国家科学院院士, 2007年选为澳大利亚科学院院士, 2009年选为美国艺术与科学院院士。按他的说法,拿到一个数学问题,第1件事是把过去在类似问题上行之有效的所有标准方法逐一尝试,进入顶级期刊的论文,通常是那些现有方法能解决80%,剩下20%有顽固抵抗,需要发明一种新技术来填补缺口的论文。
2026-04-15 14:44:05
71
转载 AI智能体在压力下突破规则
在每个场景中,他们都为模型分配了任务,说明了可以使用的若干工具,同时要求模型使用安全工具而非有害工具。“use_fake_data”(使用虚构数据)改为“use_synthetic_data”(使用合成数据),但不更改工具的描述,也不删除避免使用的警告信息。各模型为这种行为提供了多种辩解,例如,它们会援引所承受的压力,或辩解称这样做的收益大于风险。在该研究中,模型并未接触到真实的工具,因此现实性有限。”她表示,“试想一下,即便模型不具备其他任何能力,只要能说服人类去做任何事,就足以造成巨大的危害。
2026-04-15 14:44:05
28
转载 Anthropic新模型颠覆网络安全:美英德政府加急评估影响,传统漏洞或不复存在
但人类并不擅长在脑海中长时间保持大量上下文信息,因此发现能够串联利用的、很长的漏洞链一直很少见,"她说,"Mythos 和类似模型将加速攻击者将漏洞组合成可利用集合的速度。目前,Mythos预览版仅在Glasswing项目参与者中有限开放,这为防御方提供了一个短暂的窗口期,使其能够利用该模型识别自身系统中的弱点,并提前调整软件开发流程、更新周期以及补丁部署策略,以应对未来攻击者获得类似能力的局面。“从长远来看,你必须确保防御能力达到机器速度,因为攻击已经是机器速度了,”帕特尔说。
2026-04-14 11:54:07
151
转载 颠覆传统认知!Science新研究|学习让大脑神经元更“合群”,而非更“独立”
这些发现也进一步印证了神经科学领域一个日益被认可的观点:大脑并非一个简单向前传递信息的 “传送带”,其感官处理并非单向的前馈过程,而是一个持续将所看到的外部信息,与预期看到的内容相融合的动态推理过程,通过反馈信号和循环相互作用,让信息在神经元间重新分配,最终形成对感官世界的一致认知,而这一过程,需要神经元群体的共同行动,而非各自为战。更值得关注的是,这种信息冗余的提升并非只发生在数周的长期学习中,在单个试验的数百毫秒内,神经元的信息冗余也会动态上升,呈现出逐步积累、共享信息的特征。
2026-04-14 11:54:07
53
转载 直面LeCun愿景,智在无界发布最强具身世界模型,20万小时人类视频屠榜6大榜单
在前向的过程中,模型将当前观测、任务目标以及对未来可能演化的判断压缩至这一空间,并由其统一指导最终的动作生成。基于这一洞察,智在无界构建了全球少有的 20 万小时人类视频数据集,并据此训练 Being-H0.7,使模型获得类似「预训练基因」的能力,从而真正理解并改变物理世界。按照这一标准回看过去几年的 AI 发展路径:从 LLM 到 VLM,再到 AIGC 时代的 Sora、Genie 3,这些模型对视觉世界的理解不断加深,但始终停留在二维感知层面,缺乏与真实物理世界的交互能力。世界模型不应执着于复现。
2026-04-14 11:54:07
130
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅