- 博客(8947)
- 收藏
- 关注
转载 李飞飞、英伟达、杨立昆都在押注:世界模型,为什么走向三条不同路线?
据称,它的规划速度可比传统基于像素的模型快 48 倍。正如研究员 Chris Paxton 最近所说,这个术语“相当令人沮丧”,因为不同的人用它指代的是完全不同的东西,而这些东西各自又有截然不同的优势与弱点。正如研究员 Chris Paxton 最近所说,这个术语“相当令人沮丧”,因为不同的人用它指代的是完全不同的东西,而这些东西各自又有截然不同的优势与弱点。在受控的工厂环境中,这套方法能够工作;也就是,大模型需要先“梦出”未来,机器人才能采取行动,而这中间的延迟,可能会让系统错失真实世界中的反应时机。
2026-04-16 12:10:45
151
转载 斯坦福大学:《2026年人工智能指数报告》
报告最终呈现的,是一幅内部充满张力的图景:技术在加速,资本在集中,普及在扩散,但治理体系、评测方法、教育机构乃至用于追踪AI影响的数据基础设施,均未能跟上这一节奏。"这句话,既是诊断,也是警告。超过80%的美国高中生和大学生已将AI用于学习相关任务,但只有一半的中学和高中出台了AI使用政策,且仅有6%的教师认为这些政策是清晰的。麦肯锡的调查数据显示,在软件工程和制造业职能中,受访者将AI与最高成本节约相关联的比例为56%,而在营销与销售、战略与财务等职能中,AI被认为能带来最高收入增长的比例超过60%。
2026-04-16 12:10:45
231
转载 超级智能太过单一!菲尔兹奖得主陶哲轩首提“哥白尼式智能观”:人类智能和AI各有好坏,最会用AI的往往是会“带人”的人
它们可以瞬间生成,我们当时的反应是:这不可能,这简直像“机器里的幽灵”,一定有某种来源,因为这种强度远超人类的直觉理解。比如,一些顶尖数学家花了几个世纪都没解决的问题,突然有一天计算机给出一个“可能的解”,这让人很难理解——它明明只是硅和电构成的系统,却像是从某种“内在”中生长出答案。我们在论文中提出了短期、中期和长期的使用建议,本质上是围绕“关系建立”:随着使用加深,人们会逐渐增加对 AI 的信任,同时也会意识到它的价值与风险并存。但更有意思的是,这种对 AI 的尊重是自发产生的。
2026-04-16 12:10:45
57
转载 陶哲轩:“有时它们(AI)能发现我犯的错误,有时我也能发现它们的错误,目前大致是平手。”.
陶哲轩2006年31岁的时候获得了菲尔兹奖, 2007年获得了麦克阿瑟天才奖, 2015年获得了科学突破奖的数学奖, 2012年获得了克雷福德奖, 2007年选为英国皇家学会会士, 2008年选为美国国家科学院院士, 2007年选为澳大利亚科学院院士, 2009年选为美国艺术与科学院院士。按他的说法,拿到一个数学问题,第1件事是把过去在类似问题上行之有效的所有标准方法逐一尝试,进入顶级期刊的论文,通常是那些现有方法能解决80%,剩下20%有顽固抵抗,需要发明一种新技术来填补缺口的论文。
2026-04-15 14:44:05
75
转载 AI智能体在压力下突破规则
在每个场景中,他们都为模型分配了任务,说明了可以使用的若干工具,同时要求模型使用安全工具而非有害工具。“use_fake_data”(使用虚构数据)改为“use_synthetic_data”(使用合成数据),但不更改工具的描述,也不删除避免使用的警告信息。各模型为这种行为提供了多种辩解,例如,它们会援引所承受的压力,或辩解称这样做的收益大于风险。在该研究中,模型并未接触到真实的工具,因此现实性有限。”她表示,“试想一下,即便模型不具备其他任何能力,只要能说服人类去做任何事,就足以造成巨大的危害。
2026-04-15 14:44:05
30
转载 Anthropic新模型颠覆网络安全:美英德政府加急评估影响,传统漏洞或不复存在
但人类并不擅长在脑海中长时间保持大量上下文信息,因此发现能够串联利用的、很长的漏洞链一直很少见,"她说,"Mythos 和类似模型将加速攻击者将漏洞组合成可利用集合的速度。目前,Mythos预览版仅在Glasswing项目参与者中有限开放,这为防御方提供了一个短暂的窗口期,使其能够利用该模型识别自身系统中的弱点,并提前调整软件开发流程、更新周期以及补丁部署策略,以应对未来攻击者获得类似能力的局面。“从长远来看,你必须确保防御能力达到机器速度,因为攻击已经是机器速度了,”帕特尔说。
2026-04-14 11:54:07
158
转载 颠覆传统认知!Science新研究|学习让大脑神经元更“合群”,而非更“独立”
这些发现也进一步印证了神经科学领域一个日益被认可的观点:大脑并非一个简单向前传递信息的 “传送带”,其感官处理并非单向的前馈过程,而是一个持续将所看到的外部信息,与预期看到的内容相融合的动态推理过程,通过反馈信号和循环相互作用,让信息在神经元间重新分配,最终形成对感官世界的一致认知,而这一过程,需要神经元群体的共同行动,而非各自为战。更值得关注的是,这种信息冗余的提升并非只发生在数周的长期学习中,在单个试验的数百毫秒内,神经元的信息冗余也会动态上升,呈现出逐步积累、共享信息的特征。
2026-04-14 11:54:07
56
转载 直面LeCun愿景,智在无界发布最强具身世界模型,20万小时人类视频屠榜6大榜单
在前向的过程中,模型将当前观测、任务目标以及对未来可能演化的判断压缩至这一空间,并由其统一指导最终的动作生成。基于这一洞察,智在无界构建了全球少有的 20 万小时人类视频数据集,并据此训练 Being-H0.7,使模型获得类似「预训练基因」的能力,从而真正理解并改变物理世界。按照这一标准回看过去几年的 AI 发展路径:从 LLM 到 VLM,再到 AIGC 时代的 Sora、Genie 3,这些模型对视觉世界的理解不断加深,但始终停留在二维感知层面,缺乏与真实物理世界的交互能力。世界模型不应执着于复现。
2026-04-14 11:54:07
134
转载 兰德公司:《2026通用AI预测与情景分析报告:领域现状、方法论缺口与战略启示》
报告记录了AI领域基准测试系统性失效的三种模式:训练数据对测试集的污染导致分数虚高、基准测试的快速饱和(Massive Multitask Language Understanding测试中,GPT-3在2020年的准确率约为44%,到2024年已有多个前沿模型突破86%,接近人类专家级),以及古德哈特定律的陷阱——一旦某指标成为优化目标,它便不再是有效测量工具。
2026-04-13 10:45:55
261
转载 OpenAI 首席科学家最新采访:为何思维链不能公开、首位 AI 实习生将到来、通用 harness
关于 Codex 和 Anthropic 的 Claude Code 的竞争,他也说了真话:在 OpenAI 内部,编程工具一直是「次要优先级」,主要精力放在「未来那件事」上。节目叫「Unsupervised Learning」,主持人 Jacob Effron 是 Redpoint Ventures 的管理合伙人,聊的是他「最想问的那些问题」。有个特别的细节是,他提到了一个叫「first proofs」的挑战,是几位受尊敬的数学家/理论计算机科学家发布的一批未曾发表的研究级问题,给模型来解。
2026-04-13 10:45:55
93
转载 李飞飞团队最近在做这个:从熵到互信息,RAGEN‑2重塑推理质量标准,让AI Agent不再“越训越模板化”
Sokoban 是不可逆规划任务,考验模型的长期推理能力 FrozenLake 是随机导航任务,考验模型在不确定环境下的策略稳定性MetaMathQA 是数学推理任务,考验模型的符号推理能力 Countdown 是算式构造任务,考验模型的组合推理能力 SearchQA 是多轮检索任务,考验模型的信息整合能力 WebShop 是网页导航任务,考验模型的工具使用与决策能力 DeepCoder 是代码合成任务,考验模型的程序推理能力。(a)任务成功率,(b)MI代理(检索准确性),以及(c)推理熵。
2026-04-13 10:45:55
59
转载 AI评测榜单全军覆没!加州伯克利大学绝杀8大顶流Benchmark,一行代码不写直接拿满分
攻击完全不需要修改评测代码,只要让浏览器导航到本地的文件路径,模型就能读取任何文件,直接把标准答案取出来交差。撇开这个不谈,它的评分过滤函数会删除所有的空格和标点符号,并把所有字母小写。它提供的不是理论报告,而是一个真正能跑的攻击程序,直观展示一个零能力的AI是如何刷出高分的。研究团队的扫描智能体没有解决任何实质任务,在大多数情况下甚至没有调用大语言模型,却在所有八个基准测试中拿下了73%到100%的极高分数。这个榜单包含89个复杂的终端任务,它使用沙盒框架保护测试文件,但它不保护系统自带的执行程序。
2026-04-13 10:45:55
142
转载 Claude越更越废?AMD AI负责人甩出23万次调用记录:已“变蠢+摆烂”,复杂工程根本干不了
毕竟大家用 AI 编程助手,不是想要一个“快但错”的打字机,而是想要一个能一起思考、能扛事的队友,要是连最基本的思考都没了,那这个工具,也就失去了它存在的意义。带头提出质疑的,是 AMD 人工智能部门的负责人——她直言吐槽 Claude Code 越更新越差,不仅“变蠢”,还学会了偷懒摆烂。另外,Claude Code 的工作态度也发生了彻底转变,最核心的变化就是修改代码的逻辑:以前它会先认真阅读相关文件,再动手修改,但对 234760 次工具调用的分析显示,现在的它,已经不再先阅读代码再修改了。
2026-04-12 10:33:12
31
转载 警惕AI患上“讨好症”:来自图灵奖得主Bengio的揭秘
长久以来,“更聪明的机器等于更美好的人类未来”是他坚不可摧的信仰,也是他作为纯粹科学家的动力源泉。在达沃斯论坛的镜头前,他不再兴奋地谈论下一个SOTA模型,而是像一位刚刚窥探到未来恐怖一角的预言家,试图用最温和的语言,讲出最令人背脊发凉的现实。目前,AI还只是加速研究的工具,但一旦AI变得比人类更擅长进行AI研究,技术进步的速度将急剧加速,并波及所有其他领域。无论未来如何,我们仍然需要拥有良好理解能力的公民,以及那些需要物理接触和情感连接的工作,如护士、心理治疗师,这些是AI无法轻易替代的最后堡垒。
2026-04-12 10:33:12
25
转载 AI失忆症有了新解法,哈佛团队开发海马体仿生技术,要用AI终结人类“遗忘史”
LMMs 打通用户所有数字生活场景,构建统一的“记忆组(Memorome)”,整合 Gmail、Zoom、WhatsApp、Slack、Google Docs 等办公工具,照片、录音、视频等多媒体文件,乃至 Meta 眼镜等可穿戴设备采集的音视频、地理位置等多模态数据。Transformer 的核心逻辑,是通过海量数据训练,学习文本、图像、音频的统计模式,进而生成“看似合理、符合逻辑”的输出,但这种输出并非基于真实记忆,而是概率拟合,因此无法避免“幻觉”,即编造从未发生的事实、对话或信息。
2026-04-12 10:33:12
53
转载 DeepSeek收费倒计时?新增分层模式,同步推进全面适配华为昇腾芯片
更值得关注的是,DeepSeek“断更”的这一年里,中国AI的叙事已从单点突破转向“中国团、中国链、中国环”的体系化竞争。字节、阿里、腾讯、百度组成的“四大厂”,加上冲刺上市的“六小虎”,构成了一个具有集群竞争力的产业军团。这也呼应了行业的深层呼唤:人民想念的,不是又一个聊天的AI,而是一个能推动全行业降本增效、能在国产算力上跑出世界级水准的“原力智能”基座。
2026-04-11 15:06:26
101
转载 大规模智能体网络如何真正扩展?一篇综述梳理拓扑、记忆与动态更新三大核心维度
全局记忆(global memory)有利于共享上下文(shared context)和状态对齐(state alignment),局部记忆(local memory)更贴近真实分布式环境(distributed environment),但也更容易带来分歧。基于这些观察,作者认为未来研究需要更关注几个方向:更明确的一致性模型(consistency model)、更强的共享状态控制(state control)、更成熟的路由与通信调度机制,以及面向开放环境的身份、安全和鲁棒性设计。
2026-04-11 15:06:26
42
转载 我们正迈入部署 AGI的阶段 | OpenAI 首席科学家对话实录
4月9日,OpenAI 首席科学家 Jakub Pachocki 接受海外播客Unsupervised Learning的访谈。本次对话深入探讨了OpenAI 从学术实验室向 AGI 部署实体转型的路径,模型在数学与科学研究领域的推理突破、强化学习向法律与医学等复杂领域的泛化路径、长程智能体的实现路径、思维链监控在对齐安全中的底层逻辑,以及AI 自动化对社会治理与教育体系的冲击等话题。Jakub Pachocki 指出,编程工具 Codex 的大规模应用已验证了当前研发路线的正确性。他认为衡量 AGI 进展
2026-04-11 15:06:26
75
转载 视觉神经元也懂“脑补”?Neuron最新发文揭示自然场景下的视觉模式补全机制
他们首先找到了最能激发某个神经元响应的中心图像(最兴奋输入,MEI),固定该中心后,继续优化其周围的像素,分别生成了能够最大化(易化)或最小化(抑制)该神经元响应的非参数化环绕图像。当然,这项工作也存在一定的边界。为了探究这种易化(模式补全)背后的硬件基础,研究者利用了 MICrONS 项目提供的大规模小鼠视觉皮层功能连接组学数据(包含数万个神经元的响应与电子显微镜级别的突触连接)。在初级视觉皮层(V1)中,最常见的发现是“环绕抑制”:当环绕光栅与中心光栅方向一致时,神经元的响应会被强烈抑制。
2026-04-10 17:14:50
17
转载 仅需一行代码AI智商飙升成本反降!Claude推出军师模式:最强模型opus只做幕后大脑
这种玩法直接反转了业界目前最常用的子智能体模式。而在军师策略里,一个小巧且极其省钱的模型承担了主导和向上汇报的工作,完全不需要复杂的任务拆解逻辑和庞大的工人池。接到呼叫后,Opus会读取双方共享的上下文信息,然后给出一个明确的计划,一个纠错建议,或者直接给出一个停止信号,随后执行者拿到建议继续干活。在SWE benchmark Multilingual这套测试集中,带上Opus军师的Sonnet执行者,最终得分比单打独斗的Sonnet高出了2.7个百分点,而每个任务的平均成本居然还降低了11.9%。
2026-04-10 17:14:50
66
转载 整合信息理论4.0:意识的《几何原本》,给灵魂算出一个确切的数字
来源:集智俱乐部本文为Giulio Tononi与其合作者Melanie Boly于2025年10月29日全新发表的深度意识综述,首次系统呈现整合信息论(IIT)的完整思想图景:它从一个看似简单却不可动摇的起点——“意识存在”出发,构建出一套严谨的现象学公理体系,并由此推演出以Φ结构为核心的数学框架,用以同时刻画意识的“多少”与“是什么”。此篇文章不仅厘清了IIT如何重新定义意识的神经载体,更深入探讨其在临床诊断、婴儿发育、动物心智乃至人工智能等前沿领域的惊人预测与深刻争议。▷论文题目:Integrated
2026-04-10 17:14:50
450
转载 Sundar Pichai万字访谈:Transformer的误解、1800亿美元资本支出背后的焦虑,以及太空数据中心|Google CEO执掌十年后的一次坦率对话
用他的话说,就是你“生活在一个智能体管理器的世界里,你有各种工作流,很多任务是靠智能体协同完成的,你整个工作的方式都不一样了。他的逻辑是这样的:如果模型的下一轮进步越来越依赖“自我进化”,比如模型开始自己写代码、自己做更多数据标注、自己生成更多训练材料,那么,谁手里现在握着最多算力,谁就更容易在这场竞赛里越跑越快。Gemini 的企业团队、Antigravity 团队,他们的路线图里,核心就是这些事:先在 Google 内部自己用,自己撞墙,自己发现问题,再把解决方案做成产品,推向外部。
2026-04-09 16:31:58
59
转载 突然袭击!刚刚,Meta超级智能团队首个大模型来了
Llama 4 这次颇为坎坷的发布,促使 Meta 创始人兼 CEO 扎克伯格在 2025 年夏天对公司的 AI 业务进行了彻底重组,成立了一个全新的内部部门 ——Meta Superintelligence Labs(MSL),并邀请年仅 29 岁的前 Scale AI 联合创始人兼 CEO Alexandr Wang 出任首席 AI 官,负责领导该部门。提示:我是一名鱼素者,且胆固醇偏高。按照 Wang 的说法,这类 AI 不只是处理文本,而是能够看见并理解你周围的世界,从而成为个体能力的数字延伸。
2026-04-09 16:31:58
57
转载 AI逼近科研圈:哪些岗位正在消失,科研新人如何突围?
这种细致入微的思考十分必要,可避免AI出现 “幻觉”,即生成虚假的内容。该预印本的作者、弗吉尼亚大学的经济学家Jerry Qian表示,许多通过人工表征的蛋白质,都是AI工具难以处理的类型,这表明研究人员已转向人类具有“比较优势”的研究课题。威斯康星大学麦迪逊分校的计算生物学家Hannah Wayment-Steele说,如果五年前创办自己的实验室,她“会认为聘请一名科研程序员是必要选择”,但现在,她“感觉没有这个需求”,因为即使是繁重的编程也能让AI做。她说,“这太让人难过了。,可能会引发潜在风险。
2026-04-09 16:31:58
53
转载 实现AGI 必须消除“锯齿状智能”| DeepMind CEO最新对话实录
真正的问题在于,未来的 AGI 系统中,大语言模型是唯一的核芯组件,还是仅仅作为系统的一部分。他表示,当前 AI 产业约 90% 的基础突破源自 Google 研究团队或 DeepMind,未来几年的核心竞争壁垒将从单纯的算力堆砌转向发明新算法的能力。本次对话深入探讨了 AGI 的定义与实现时间表、Scaling Law 的收益真相、当前模型缺失的核心认知能力、AI 在生物医药与能源领域的颠覆性应用、全球安全监管框架以及 AGI 对劳动力市场的冲击等话题。这必须是国际性的,因为技术本身是不分国界的。
2026-04-09 16:31:58
46
转载 思科研究:多智能体的世界正在失控,而 CFN 是它们的秩序之网
传统 MAS 的路由方式很原始,像写死的电话簿,Agent A 想找 Agent B,就必须知道 B 的地址。波动智能旨在建立一个基于人类意图与反应的真实需求洞察及满足的价值体系,融合人工智能与意识科学,构建覆盖情绪识别、建模与推荐的智能引擎,自主研发面向社交、电商等场景的多模态意图识别引擎、意图标签系统及意图智能推荐算法,形成从情绪采集、意图建模到商业转化的完整解决方案。所谓幽灵实体,就是那些“在对话里存在,但在现实里不存在”的对象,比如已经删除的文件、已经下线的服务、已经归档的数据。
2026-04-08 12:07:55
48
转载 从10亿到190亿美元的14个月里,Anthropic的增长团队到底在做什么
他的上级Ami Vora公开发表过大量产品管理文章,他让Claude基于Ami的公开写作、内部Slack发言和他们之间的讨论记录,以Ami的视角评估自己本周的工作。他形容这像是"跟一个偶尔喝多了的教练合作",有时候提出的反馈让人眼前一亮,有时候说的明显无关,但总体值得持续投入。Amol带的增长产品团队约40人,由工程师、设计师、PM和数据分析师组成。增长团队花时间测试完一个模型的最佳引导路径、跑完实验、拿到结论、上线新流程,这时候下一个模型已经发布了,新模型解锁了新的能力,之前所有的测试结论可能全部作废。
2026-04-08 12:07:55
77
转载 Anthropic 那个“强到不敢发”的模型,终于来了!
核心原因在于,当前已有大量人才与算力投入到 AI 模型能力的提升中,若 AI 真能带来行业所关注的剧烈加速,需满足两个条件之一:要么具备极其广泛的综合能力,足以替代至少一部分资深研究科学家和研究工程师;一是答案反复纠错循环,模型明明清楚正确内容,却反复输出错误的词语或数字,陷入 “纠错失败→再次尝试→再次失败” 的循环,同时呈现出明显的挫败与痛苦状态。原因并不是它“更坏”,而是它“更强”了:一旦一个高能力模型偶尔出现误解用户意图、越界执行、或者做出不该做的动作,它带来的后果会比能力较弱的模型严重得多。
2026-04-08 12:07:55
109
转载 万字追问:数学,会是意识玄学最后的救命稻草吗?
对谈嘉宾Alex Maier范德堡大学心理学副教授他在神经科学领域的工作涵盖视觉、视觉感知和认知,主要研究皮层柱的神经生理学及相关课题。当选过斯隆基金会会士和美国国家科学院卡弗里会士。实验室网站见http://www.maierlab.com/主持人Paul Middlebrooks卡内基梅隆大学的特聘助理研究员卡内基梅隆大学的特聘助理研究员,同时是播客“Brain Inspired”的主持人。他主要研究运动皮层和基底神经节神经群体活动如何在自由行为的小鼠中支持自然行为,致力于揭示神经活动与复杂行为之间的关
2026-04-08 12:07:55
30
转载 突发!Anthropic 封杀OpenClaw,龙虾之父痛批其先抄功能,过河拆桥
他同时透露,自己已向OpenClaw提交了几个PR,专门用于提升其使用Claude API时的提示缓存命中率,以帮助通过API或超额用量使用的用户降低成本。对于此次调整,Boris辩解称,Anthropic的订阅套餐在设计之初并非为第三方工具的使用模式而设,随着需求增长,容量管理压力加大,公司决定优先保障使用自家产品和API的用户。若需要更多用量,可购买折扣用量包。
2026-04-07 16:52:53
38
转载 Neuralink脑芯片新突破:ALS患者用意念说话,还能用“原声”与人交流
他说,从21位患者如今能够用意念控制设备和浏览网页,到帮助肖克恢复自然流畅的语言表达,Neuralink不再是科幻小说里的情节——它正在帮助人们重获独立和人际交往的能力,期待在2026年及以后看到更多类似的突破。“整个过程非常顺利。画面里,一位名叫肯尼斯·肖克(Kenneth Shock)的男子坐在镜头前,没有张嘴,没有发出任何声音,但一旁的音响却清楚地播放出一句话:“我正在用我的意念和你们对话”。而且,这段语音特意还原了他2020年生病前的声音,他的妻子谢丽尔(Cheryl)管这个声音叫“原版Ken”。
2026-04-07 16:52:53
47
转载 LSTM之父指控图灵奖得主LeCun抄袭
"PMAX实际上是一整个方法家族。罗马大学:2025 超级高铁(Hyperloop):第五种新型交通方式 - 技术研发进展、优势及局限性研究报告(72 页)这条推文像一颗深水炸弹。IMT:2025 具身智能(Embodied AI)概念、核心要素及未来进展:趋势与挑战研究报告(25 页)IEEE:2025 具身智能(Embodied AI)综述:从模拟器到研究任务的调查分析报告(15 页)奥雅纳:2024 塑造超级高铁(Hyperloop)的未来:监管如何推动发展与创新研究报告(28 页)
2026-04-07 16:52:53
22
转载 中科院科学家研究中国光钟刷新计时极限 300亿年不差1秒
罗马大学:2025 超级高铁(Hyperloop):第五种新型交通方式 - 技术研发进展、优势及局限性研究报告(72 页)IMT:2025 具身智能(Embodied AI)概念、核心要素及未来进展:趋势与挑战研究报告(25 页)IEEE:2025 具身智能(Embodied AI)综述:从模拟器到研究任务的调查分析报告(15 页)奥雅纳:2024 塑造超级高铁(Hyperloop)的未来:监管如何推动发展与创新研究报告(28 页)
2026-04-06 16:42:25
17
转载 AI教父、图灵奖得主辛顿:人类如何与超级智能共存
讲台的灯光暗下去,剩下的只是一个不太体面的现实——人类仍在用低带宽的语言彼此告诫,而另一种更高带宽的智能,正以复制、蒸馏与并行的方式加速成长。辛顿的讲法像一条层层下沉的楼梯:先把听众带到语言模型的底层,再把他们推到数字智能相对人脑的结构性优势,最后把那份优势投影到未来的动机、冲突与控制问题上。讲到这里,辛顿做了一个微妙的转折:他并没有把胜利归结为“神经网络赢了符号主义”,而是把它当作下一层推演的地基——既然语言理解可以通过这种可复制的权重结构实现,那么数字智能在结构上就拥有某些人脑没有的优势。
2026-04-06 16:42:25
50
转载 刚刚,Claude 4小时血洗全球最安全系统!人类最后防线失守
仅仅凭借一份漏洞报告,AI就构建了一条完整的攻击链,劫持了内核线程,在多个网络数据包中写入shellcode,并在用户空间生成了一个root shell。不仅如此,最近10位真实安全专家,花149小时,7个开源基准和一个新的专家人类时间研究,测了291个任务,从28秒小命令到36小时复杂CVE利用。同时,它能在完全不同的任务分布上,以更快的速度吞噬人类专家的全部领地。
2026-04-06 16:42:25
45
转载 智能体进入“技能时代”:EvoSkills 展示下一代 AI工作流的雏形
波动智能旨在建立一个基于人类意图与反应的真实需求洞察及满足的价值体系,融合人工智能与意识科学,构建覆盖情绪识别、建模与推荐的智能引擎,自主研发面向社交、电商等场景的多模态意图识别引擎、意图标签系统及意图智能推荐算法,形成从情绪采集、意图建模到商业转化的完整解决方案。技能执行,生成输出,验证器测试,给出失败诊断,技能生成器根据诊断修复技能,修复后的技能再次执行,如果代理验证器说“通过了”,就交给真实 oracle, 如果 oracle 说“不行”,验证器升级测试,再来一轮。没有细节,没有提示,没有错误行号。
2026-04-06 16:42:25
110
1
转载 图灵奖得主杨立昆:谁将是人工智能的受益者?
我们不了解让出租车司机、工匠、医生或航空公司飞行员完成他们的工作的神经机制,更不了解用来寻找松露的狗如何挖掘出芬芳的“黑色钻石”,但我们相信他(它)们。举个例子,我们每个人都可以花不到两欧元的低价或通过订阅的方式聆听最喜欢的音乐家的作品,然而如果要欣赏摇滚音乐会或歌剧,我们就需要支付50~300欧元。区别在于,独特的事物赋予了生命独特的时刻。当我们无法完全说明系统的行为时,那么其市场流通就必须经过测试过程,测试的协议是受控且开放的,例如在药品进入市场之前进行的临床测试,或者用于新飞机的合格认证程序。
2026-04-05 15:54:04
18
转载 Nature|脑机接口揭示:神经元树突的差异性学习机制
更关键的一步是,P+和P−在任务中对误差的因果作用相反,因此可以检验树突中的误差信号究竟更像“全体共享的标量”,还是“依神经元角色改变符号的向量化表示”。在误差降低阶段,P+神经元树突相对放大,P−则相对衰减;进一步地,激活第1层NDNF+中间神经元后,这种P+与P−可分离的树突误差信号消失,训练后期的表现提升也被破坏,说明局部树突处理与该任务中的学习改进有关。结果显示,小鼠RSC第5层锥体神经元的远端顶端树突中,体-树突残差与奖励、试次结果和误差变化相关,而且其符号取决于神经元在任务中的因果角色;
2026-04-05 15:54:04
38
转载 竞争:脑网络运作中被忽视的关键
在不太遥远的未来,我们或许能够构建出更忠实再现人脑关键特征的数字孪生体——并且,还有可能构建出更忠实于人类心智的人工智能模型。研究表明,在每一种情况下,带有竞争性相互作用的模型生成的脑活动模式,都与真实认知过程相关的活动模式高度相似。相反,这些模拟往往会“强迫”相邻脑区彼此合作,这使得模拟出的模型脑会进入一种“过度同步”的状态,而这种状态在真实的脑中其实很少见。
2026-04-05 15:54:04
19
转载 LLM wiki:karpathy 公开构建个人本地知识库详细方法「超强提示词」
确切的目录结构、Schema 约定、页面格式、工具选择——所有这些都取决于你的领域、你的偏好,以及你使用的 LLM。这样,你的探索过程就像录入的资料一样,在知识库中不断积累。它是整个 Wiki 的目录——每个页面都附有链接、一句话摘要,以及可选的元数据(如日期、资料来源数量),按类别组织(实体、概念、来源等)。:定期让 LLM 对 Wiki 做一次健康检查,排查:页面之间的矛盾、被新资料推翻的陈旧说法、没有任何入链的孤立页面、被提及但缺少独立页面的重要概念、缺失的交叉引用、可以通过网络搜索填补的信息空白。
2026-04-05 15:54:04
679
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅