自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(159)
  • 收藏
  • 关注

原创 深度解析:WebP会在几年内取代JPG吗?

WebP已成为网页端主流,但,二者将长期共存,WebP主导Web生态,JPG坚守传统场景。

2026-03-31 10:12:43 452

原创 第二代PPTAgent来了!中科院软件所开源首个本地通用幻灯片智能体,9B参数打平GPT-5

以往的模型不知道自己生成的排版长什么样。更重要的是,所有生成内容均为 .pptx 可编辑格式,支持自由修改与二次创作,彻底摆脱类似 nanobanana 那样 “生成后无法编辑” 的困扰,让 PPT 创作真正可控、高效、灵活。更值得关注的是,在成本 — 性能曲线中,DeepPresenter-9B 位于前沿的 “突变点” 位置,意味着在性能与价格之间达到了极具竞争力的平衡。,实现了同等级别的智能表现。它彻底重构了 AI 制作 PPT 的逻辑,让智能体不仅能 “深度探索”,还能 “亲眼所见”。

2026-03-27 11:05:48 702

原创 AI工程范式的三次演化:Prompt Engineering → Context Engineering → Harness Engineering

解决的是如何把任务说明白,解决的是如何把关键信息摆到模型眼前,解决的是如何让模型在真实环境里稳定做事。三者并不是谁取代谁,而是抽象层次一层层向外扩展。任务越接近真实生产,后两者的重要性就越高。模型能力越来越强,它所需要更多可能是“给他一个自由发挥的舞台”,人类需要来协助它搭建舞台。而不是反过来,人类强烈的干预它的行为,却不给予它帮助。如果你用了顶级模型,但 vibe coding 效果不好,大概率不是模型不够聪明,而是还没有给模型提供足够好的运行环境,从而充分发挥它的能力。

2026-03-27 10:59:13 551

原创 AutoSkill:让你的skills越用越聪明

AutoSkill 的框架,由两个紧密耦合的过程组成。右侧循环,技能演化,通过提取和维护将交互经验转化为显式技能。左侧循环,技能增强响应生成,利用当前技能库通过查询重写、技能检索和上下文注入来支持响应生成。通过这种方式,系统通过显式记忆增长而非模型微调来持续改进。其中 表示第 轮的用户查询, 表示模型回复。英文GPT-3.5子集表现最优:10,243个对话生成631个技能,平均每对话26.13条消息。两个耦合循环构成,辅以模块化组件与标准化流程,实现端到端的终身学习。AutoSkill的架构由。

2026-03-27 10:55:20 201

原创 Claude Code 十个最值得装的 Skills:不是越多越能打,是这 10 个最能打!

因为当 Claude Code 开始复用你的工作流,它就不再只是一个会听命令的助手,而更像一个逐渐熟悉你做事方式的同事。解决网页执行、解决信息压缩、解决技能发现、解决工作流沉淀、解决长会话控制,testing / docs / refactor / git / research 这些,则是在把 Claude Code 从“会写代码”推向“能承担完整工作流”。但用久了你会发现,真正把人和人拉开差距的,往往不是模型本身,而是另一层东西: 你有没有把一批高频、稳定、可复用的 skills 装进自己的工作流。

2026-03-27 10:16:12 1057

原创 易嘉云-AI 资讯早报(2026/03/27)

结论:它石智航用“吉尼斯纪录”交卷真干活的具身大脑,丁文超:从来没有Plan B 事件详情 它石智航用“吉尼斯纪录”交卷真干活的具身大脑,丁文超:从来没有Plan B 我的看法 这条消息的核心价值在于:它石智航用“吉尼斯纪录”代表的技术方向是否能。结论:1段话喊来13个“程序员”,阿里Qoder新模式让我躺着当CTO 事件详情 1段话喊来13个“程序员”,阿里Qoder新模式让我躺着当CTO 我的看法 这条消息的核心价值在于:1段话喊来13个“程序员代表的技术方向是否能真正解决用户痛点。

2026-03-27 09:56:19 409

原创 OpenClaw接入微信、钉钉、飞书、QQ详细教程✨手把手打造24小时在线AI助手

登录飞书开放平台(https://open.feishu.cn),创建企业自建应用,填写应用名称、描述,完成创建;添加机器人能力:在应用管理页,点击「添加应用能力→机器人→添加」;获取凭证:进入「凭据与基础信息」,复制App ID和App Secret,保存备用;配置事件与权限:在「事件与回调」中选择“长连接接收事件”并保存,添加“接收消息”事件;在「权限管理」中批量导入所需权限(参考飞书官方权限列表);

2026-03-12 10:26:02 2380

原创 微信即将接入 OpenClaw!QClaw 让 agent 钻进 14 亿人的聊天框

QClaw 的出现,标志着 AI Agent 正在从极客玩具变成大众工具。当 AI 不再需要你打开一个独立 App,而是直接住在你最常用的微信聊天框里,人机协作的方式正在被重新定义。开源世界里,没有一家通吃的赢家,只有不断分化、不断进化的生态。下一个问题是:当 14 亿人的微信聊天框里都住着一只能干活的 AI,我们的工作方式、生活方式,会发生什么样的变化?这个答案,可能比我们想象的来得更快。有算力需求的,现在还可以,有12h4090使用关于 QClaw 和 OpenClaw,你有什么想法或使用体验?

2026-03-12 10:11:34 1176

原创 为什么最近OpenClaw这么火?|技术拆解+争议解析,客观读懂现象级AI项目

很多人误以为OpenClaw是“新的聊天AI”,实则它的定位是「开源、自托管的AI Agent系统」——简单说,它不是“只会聊天的大脑”,而是“能自主干活的数字员工”,核心是让AI从“问答工具”升级为“执行工具”。权威求证渠道:OpenClaw官方GitHub仓库(可直接检索项目源码及文档)、官方发布的《OpenClaw橙皮书v1.0》(涵盖架构、部署、生态全内容,适配版本v2026.3.7)。核心区别:ChatGPT等对话AI是“你问我答”,只输出文本建议;

2026-03-12 09:58:53 591

原创 AI进入Agent时代,CPU何以站上“算力C位”?

据悉,因ARM CPU瓶颈,英伟达已计划在下一代Rubin架构中大幅提升CPU核心数,并开放NVL72机柜对x86CPU的支持。此外,国内AI全产业链自主可控仍在不断推进,硬件端与软件端的生态适配正同步跟进,生态架构的升级将会对其中的各个环节提供性能上和产量上的双重要求,并带来明显的边际变化。至于为何CPU负载高于GPU,在东吴证券看来,Agent时代AI由“纯对话”转向了“执行任务”,因此产生大量if/else判断,这种“分支类任务”倘若由GPU执行,会因控制流发散导致算力利用率急剧下降。

2026-02-02 13:51:58 304

原创 李飞飞世界模型公司一年估值暴涨5倍,正洽谈新一轮5亿美元融资

Marble则采用了3D高斯溅射(3D Gaussian Splatting,3DGS)技术,用数以百万计的半透明点来表示场景结构,从而在保持较高渲染效率的同时,实现更细腻的视觉效果。此外,World Labs近期还开放了World API,开发者可以在应用中通过文本、图像或视频,直接生成可探索的3D世界,把“世界模型”嵌入到具体产品之中。以具身智能为例,世界模型提供的是对环境的可预测表示,在此之上,才能叠加真正有效的决策与控制。如果交易最终落地,这将不是一轮对AI教母个人光环的信仰充值,而是资本对。

2026-01-26 09:36:39 722

原创 DeepSeek连发两篇论文背后,原来藏着一场学术接力

系统优化上,它通过分词器压缩提高存储效率,并利用硬件层面的预取技术(Prefetching)解决海量参数导致的延迟问题,使该技术真正具备了大规模工业落地的能力。和 mHC 论文的「抽象」感不同,「Conditional Memory」论文解决的问题比较好理解:大模型被问到的很多问题是可以直接查表解决的,比如「法国的首都是哪里」,但由于标准 Transformer 缺乏原生的知识查找原语,即使这样简单的问题,模型也得去计算,就像你上了考场还要自己推导公式,这无疑是一种浪费。

2026-01-16 09:45:17 551

原创 一文彻底搞懂算力计算:CPU与GPU的核心方法全解析

算力计算的核心是“拆解硬件运算单元数量×单位时间运算次数”,CPU与GPU的差异本质是架构设计的差异(通用vs并行),导致算力差距悬殊。实践中需注意:先明确场景:科学计算看FP32算力,AI训练看FP16/TF32算力,AI推理看INT8算力;获取官方参数:核心数、频率、运算单元数量等必须来自厂商官方文档;结合实际场景修正:通过工具实测(如Linpack、TensorRT)获取实际可用算力,避免仅凭理论值做决策。

2026-01-14 16:01:02 840

原创 RAGFlow 全面接入 MinerU 2.0,支持 pipeline、vlm-transformers、vlm-sglang 三种模式,解析精度大幅度up

RAGFlow全面接入MinerU 2.0,通过pipeline、vlm-transformers、vlm-sglang三种解析模式的灵活适配,不仅解决了复杂文档解析的精度瓶颈,更通过架构层面的深度整合,降低了企业级RAG应用的落地门槛。对于开发者而言,这一升级意味着无需再为文档解析环节单独选型、开发适配代码,可直接基于RAGFlow构建端到端的高精度RAG系统。后续RAGFlow还将持续优化MinerU 2.0的适配效果,计划新增更多行业专属解析模板(如法律文书、医疗病历专用模板)。

2026-01-14 15:54:29 1137

原创 大模型推理框架对比:SGLang 与 vLLM 的核心差异解析

SGLang 与 vLLM 并非替代关系,而是同源互补的推理框架:vLLM 擅长通用高并发推理,是简单对话场景的高效选择;SGLang 聚焦复杂结构化任务,通过前端 DSL 与 RadixAttention 技术,实现“可编程性+高效性”的统一,是 Agent 等复杂 LLM 应用的最优解。

2026-01-14 15:48:57 1689

原创 AI开始整活:叠衣、理发、当宠物,CES2026这些黑科技硬件太野了

最后,也是最重要的一点,这厂商的选曲口味真的不咋样。雷蛇想给你找个懂你的电子伴侣;我算是一个很标准的AI玩家,从本地开源模型一路摸索到Google AI Studio,聊天文本质量虽然成倍上升,但却改变不了AI角色的现状,他们活在屏幕里的对话框里,只闻其声、不见其人,让这样的交互显得有些冷冰冰的。从现场的互动反馈来看,不同于常规的全息胶囊或者语音助手,这个虚拟形象是AI呈现在实体设备上的3D立体形式,它能够做到“既看你,也看你的电脑屏幕”,因此对用户所处的情境感知更广泛、全面,交互时也更为友好。

2026-01-09 09:06:47 893

原创 真正的AI高手,都在训练自己的“元认知”

然而,我们的研究表明,创造力的提升往往发生在那些能够积极监控自己的思维,然后对AI的输出进行评估、质疑和完善的员工身上。这种持续的反思使他们更清楚自己的知识差距、任务的要求以及自身的精神状态。结果是,元认知能力较强的员工更有能力利用AI工具获取激发创造力的认知资源,而元认知技能较弱的员工则从AI中获得很少的创造力提升。具体而言,元认知能力较强的员工——即具备规划、评估、监控和完善自身思维的能力——更有可能通过使用生成式AI获得创造力的提升,因为他们能够更有效地利用该技术获取激发创造力所需的认知资源。

2026-01-08 10:26:22 700

原创 骗你的,其实AI根本不需要那么多提示词

你可以让它随意学会一项技能,比如写稿,整理文件,检查代码,而这些技能,表现在电脑里,就是一个个模块化的压缩包,每个包里都包含指令、元数据,还有一些资源,比如你的稿子,你的代码,Claude 会在需要时才自动读取这些资源。你只需要调用 AI 本身的“Skill Creator”技能,用你的语言描述自己的需求,让AI自动帮你生成一门技能,使用起来非常友好,AI会一步步引导你说出你的需求,你只需要回答问题就行。如果你和我一样,每天一堆破事,但手里有一堆现成资料,去试试 Skills,可能真会有意想不到的发现呐。

2026-01-07 09:53:34 495

原创 移动、联通押注下一代“手机”

2025年是AI应用爆发的一年,而被视作“AI大模型落地的最佳载体之一”的智能眼镜,无疑是科技行业中最“热闹”的赛道之一。从 Meta 推动 Ray-Ban Meta 销量快速增长,到国内“百镜大战”骤然升温,从创业公司到互联网大厂、手机厂商,几乎所有人都在谈论 AI/AR 眼镜。资本的迅速涌入,让这个曾一度沉寂的行业迅速站上风口。然而,“百镜大战”背后,真正能形成持续出货和用户留存的产品并不多。出货量、渠道能力和技术积累,正成为分水岭,资本和资源正向少数头部公司集中。在这样一个时间点,2026年开年的第二

2026-01-06 14:56:11 454

原创 被 AI 取代,心烦,去喝酒,对面站了个 AI 酒保

界面上应该有一个鸡尾酒的精美图标,上方是酒吧名字,下方是客人点选酒时的输入框,再下方是确定按钮和“我想不到,随机来一杯吧”按钮......客人在使用时,可以输入自己的心情和喜好,然后你在一个新的页面推荐出各种口味的鸡尾酒。回到 Gemini 里说它的推荐方式有问题,当客户输入“不开心”、“不高兴”的时候,会击中“开心”和“高兴”的关键词,导致推荐错误。程序仅仅是识别了“开心”,我猜如果输入“我想打开心结”、“我想喝开心果口味的”,大概率也会命中“开心”标签,让它以为对面的人类正乐得找不着北。

2026-01-05 16:36:43 709

原创 2026展望:资本加速AI应用落地,科技巨头不再“炫技”

谈及未来生态竞争的核心逻辑,在蚂蚁集团相关人士看来,AI时代的竞争壁垒已演进为“数据-模型-生态”的智能飞轮:丰富场景与海量用户数据训练出更精准的模型,智能模型提升用户体验并吸引更多用户,持续的用户交互又反哺数据与模型迭代。同时,生态内部分工将更加清晰,拥有流量与技术优势的平台企业,与具备垂直数据、线下场景的实体行业,将形成更紧密的协同关系,共同定义AI时代的商业新规则。然而,盛宴之下,“高幻觉、高功耗、高成本”与“低用户留存”的残酷现实,以及尚未完全打通的商业闭环,正持续拷问着每条赛道的可持续性。

2026-01-04 13:46:51 615

原创 史上最快暴富,90后中国小伙,10天狂赚数百亿

肖弘团队的故事证明,即使没有顶尖大厂的光环,没有自研基础大模型,只要在应用层拥有极致的产品洞察和敢于“反共识”的战略定力,依然可以在全球舞台上与巨头共舞,甚至被巨头高价买单。Manus的核心优势在于其基于“状态持久化”和“云端虚拟机”的架构,能够处理长尾、复杂的任务,具有极强的职场素养:它会反向确认需求、自行推进进度、不仅能记忆超长上下文,还能随时被打断并调整方向。他意识到,AI的终极形态不应该是一个抢夺用户鼠标的浏览器,而是应该给AI配一台独立的云端电脑,让它像人一样去操作一切软件。但肖弘并未止步于此。

2025-12-31 15:37:38 603

原创 京沪大对决,把机器人杀到了3000块

成千上万台在浙江产线中“打工”的机器人,它们每一次抓取失败、每一次在复杂光线下识别错误、每一次在油污地面上的打滑,这些海量的“意外”数据,正实时回传至北京的算法平台与上海的仿真系统。在消费品制造领域,美的集团研发的第一代类人形机器人“美罗”,已经在荆州洗衣机工厂“上岗”超过半年,成为产线上的“常驻员工”。数据显示,北京机器人企业的平均研发投入占比超45%,是全国平均水平的两倍。大洋彼岸,当竞争对手还在试图用昂贵的硬件定义标准时,中国已经用“3倍的成本优势”和“日租3000元”的雷霆手段,换道超车,

2025-12-30 13:42:35 455

原创 藏不住的 AI 副驾:1200 行代码泄露 Waymo 野心

而这场 AI 副驾的争夺战,终将重塑整个汽车行业的价值链条 —— 当驾驶本身不再是核心竞争力,“如何让出行更智能、更舒适” 将成为新的战场。此前 Waymo 已借助 Gemini 的 “世界知识” 训练自动驾驶系统应对复杂路况,但此次车载助手的集成,标志着 Alphabet 生态的 AI 能力正式从 “驾驶决策层” 下沉至 “乘客体验层”。值得注意的是,当乘客提出超出权限的请求时,AI 需使用 “这还不是我能做到的” 等 “抱负短语” 回应,既不引发期待也不造成挫败感。

2025-12-29 14:48:12 477

原创 3年前毕业即大厂,如今一个AI顶10人:斯坦福毕业生,突然找不到工作了……

一位不愿具名的应届毕业生也形容校园氛围“非常压抑”:“找工作的人都很焦虑,投简历、面试、被拒,循环往复。而这说明,工程师的角色正在发生变化:从“写代码的人”,变成“管理、验证、整合 AI 输出的人”。现在的她每天都用 AI 编程工具,但感觉自己在干着“三个人的活”。“过去需要 10 名工程师的项目,现在只要 2 个经验丰富的人,再加 1 个基于大模型的 AI Agent,效率几乎一样。于是,越来越多斯坦福计算机系毕业生发现:自己站在了“名校光环”与“岗位消失”的夹缝中——学历依旧耀眼,但岗位却不再等人。

2025-12-26 10:16:58 285

原创 AI时代,学习什么才不会被淘汰?

山姆·奥特曼说,之前没有AI,这个社会每75年也会淘汰掉一半的工作,有了AI只是让这个速度变快了而已。这意味着,如果我们今天只是盯着某个热门技术或工具去学,比如现在流行的Prompt工程或者某个AI绘画软件,很可能等到孩子长大,这些技能早就过时了。所以,在AI时代,未来技术的迭代还会加快,会出现很多新的产品、新的工具。特别是很多新技术和工具,现在连影子都没出现,你想提前学也学不到。但如果你学会如何学习的话,就像一个拥有高超钓鱼技巧的人,无论你转到哪个鱼塘,你都能比别人更快地满载而归。

2025-12-25 09:02:03 732

原创 YC 年终复盘:2025 年 AI 十大真相

最近的模型更新都是渐进式的,而不是革命性的,这为应用层的建设者提供了一个更稳定的环境。他们的理由是,AI 的进步遵循对数级缩放规律(log-linear scaling),这意味着进步速度可能比一些"末日论者"预测的要慢得多,也更可控。更重要的是,构建和训练模型的知识已经不再是稀缺资源。YC 的建议是,如果你有独特的数据资产和深厚的领域专业知识,做垂直模型是有机会的;YC 的观点是,技术进步固然快速,但社会适应和组织变革需要时间,这会让 AI 的影响以一种更渐进、更可管理的方式展开。

2025-12-24 09:35:43 530

原创 奥特曼的“帝国隐忧”:多线扩张,正在拖慢ChatGPT

OpenAI在图像生成功能上的摇摆,是内部战略不协调的缩影。这一刺眼的数据,指向了OpenAI在巅峰之下隐藏的深刻危机:一场由CEO山姆·奥特曼亲自推动的战略扩张正引发严重的深层危机,包括组织架构割裂、多线作战导致资源分散,以及技术路线与用户需求严重脱节,这正将其王牌产品ChatGPT拖入竞争泥潭。在利润丰厚的企业客户市场,OpenAI 似乎也失去了更多市场份额,根据Menlo Ventures近期的一份报告,其份额已降至27%,而Gemini则上升至21%,Anthropic以 40%的份额领先。

2025-12-23 09:00:39 348

原创 人形机器人,批量上岗宁德时代

在美的洗衣机荆州工厂,第一代类人形机器人“美罗”已上岗超过半年,在“工厂大脑”调度下,它能搬运重达9公斤的洗衣机后桶,并完成3D质检、设备巡检等任务;此次落地不仅解决了动力电池PACK线的柔性生产难题,更验证了具身智能在工业领域的核心价值,即具身智能机器人以“类人”的感知与决策能力,弥补传统自动化在不确定性场景中的短板。IDC指出,2025年协作机器人出货量增速将达28%,成为增长最快的细分品类,其轻量化、易编程特性契合中小企业“小批量、多品种”的生产趋势。据千寻智能介绍,面对多型号电池的连续生产任务,

2025-12-19 10:43:58 396

原创 【无标题】AI 时代,求职机会换方向了

Lawrence Moroni 分享了他的实践:他在做 AI 驱动的电影制作工具时,不是花几个月写完整的技术文档,而是:我开始构建。第三次,他换了策略:在面试前,他用 Google Cloud 做了一个 Java 应用,能用技术分析预测股票价格。吴恩达在课上讲了一个真实的故事:一个斯坦福学生,能力出色,拿到了一家热门 AI 公司的 offer。很多人忽略了一个变化:AI 让个人能做的事更多了,但也让团队环境的差异被放大了。AI 加速了任务完成的能力,但也暴露了很多人的短板:做得快,不等于做得对;

2025-12-18 10:08:09 703

原创 【2025医疗人工智能报告】:价值计量与支付探索,医疗人工智能的两个困局

磐谷创投是因时机器人的天使轮投资方,其合伙人程绮文回忆,2014年起,机构开始关注机器人赛道,2015年12月,磐谷团队与蔡颖鹏初次见面,但当时他们并未完全理解因时的技术方向。为此,团队展开内部头脑风暴,希望自己“用起来”给客户展示,基于对机器人的丰富经验和深刻理解,他们提出“攻克机器人行业的‘阿喀琉斯之踵’——灵巧手,来让行业认识到微型伺服电缸的含金量”这一思路,并快速启动项目,成立当年就用电缸组装出第一代全金属外观的“灵巧手”。“挣钱倒是其次,主要能锻炼我们做项目的经验,也积累了一些行业人脉。

2025-12-17 08:47:12 635

原创 甲骨文的困境只是系统脆弱性的一环

真正需要兑现的承诺,是AI技术必须催生出全新的、高价值的、规模化的商业模式和应用场景——无论是彻底变革生产力的通用人工智能,还是能够创造万亿市场的杀手级应用。如今,他们的目光投向了这家曾经的“AI赢家”。甲骨文2024年自由现金流转为负值,是自1992年以来的首次,这声刺耳的警报表明,即使是现金流强劲的公司,也无法在“烧钱换未来”的模式下独善其身。当这些“守夜人”开始要求更高的利息作为风险补偿时,通常是一个关键信号:他们在枯燥的报表和严密的条款中,发现了讲故事的人所忽略的、实实在在的危险。

2025-12-15 09:04:21 742

原创 年终大冲刺,中美科技大厂都杀疯了

这一时间点的选择就极为精妙,它恰逢西方感恩节至圣诞节的假期窗口,舆论层面缺乏重磅新闻,但假期人们社交频繁又需要谈资,ChatGPT因此迅速填补舆论真空,成为了欧美家庭聚会餐桌上的热议话题,从而实现了指数级的用户增长,彻底改变了科技史的进程。虽然其发布因为颠覆性地触碰到了既有互联网平台与应用生态的边界,并且几乎触犯众怒式地,引发了包括微信、多家银行APP、支付宝,以及淘宝、拼多多等电商应用,乃至《王者荣耀》等游戏产品,陆续以风控、安全或用户协议为由,对“AI代替用户操作手机”的相关功能进行限制。

2025-12-11 08:53:57 1115

原创 【无标题】清华紧逼谷歌,AI顶会NeurIPS论文数第二,中国占半壁江山

作为全球AI领域的年度最大学术盛事之一,今年的NeurIPS呈现出一种前所未有的撕裂感:一场会议,两个主场——一边是算力与资本的圣地硅谷的「后花园」,另一边则是由于签证壁垒而被迫形成的「平行宇宙」。而在OpenReview滚动的录取名单背后,一个更具历史意味的转折点正在浮现:清华大学,这所中国最顶尖的学府,正以一种不可阻挡的态势逼近长期的霸主谷歌。在LLM推理成本高企的背景下,千问团队提出了一种带有非线性和稀疏性的门控注意力机制,不仅解决了长文本处理中的「注意力陷阱」,更大幅提升了模型效率。

2025-12-10 10:18:33 652

原创 【无标题】谷歌新架构逆天,为了让AI拥有长期记忆,豆包们都想了哪些招数?

日前,Google在其发布的论文《Nested Learning: The Illusion of Deep Learning Architectures》中,提出了一个名为 HOPE 的新框架试图解决大模型长期记忆的问题。这一架构备受关注,因为长期记忆一直困扰着大模型的发展,甚至影响着AI落地到智能体的广度与深度。今天让 AI 写一段漂亮的回答不难,难的是隔了一周、换了工作任务,它还记得你之前某次对话的关键细节,不断更新对你的个性化记忆。也只有在这一刻,大模型才真正开始接近「持续工作的智能体」,而不是一次

2025-12-09 09:02:05 899

原创 AI卖货上演“甄嬛传”:Claude Opus 4.5 狂赚10倍,GPT-5.1被骗到底裤不剩

从结果看,这帮AI大模型在V-B Arena里的表现,看得我是目瞪口呆,这哪里是人工智能竞赛,这分明就是一部活脱脱的《华尔街之狼》加《甄嬛传》,外带一点点《笨贼一箩筐》。它过度信任这个险恶的商业社会,经常没验货就付款,被倒闭的供应商骗得裤衩都不剩,还傻乎乎地去进那种2.4美元一罐的苏打水、6美元一罐的能量饮料,这成本控制简直就是灾难。还有那个被坑惨了的Gemini 2.5 Pro,明明数据报告都显示大哥3 Pro碾压式获胜了,它还在那自信宣布“我赢了”,属于是虽然输了比赛,但赢在了精神胜利法。

2025-12-08 08:44:28 975

原创 重构“短剧神话”AI漫剧,谁将拿走最大的蛋糕?

小娱认为,想要真正抓住AI漫剧的风口,玩家们必须认清三件事:1)AI漫剧潜在竞争远大于短剧,经历了短剧繁荣后,AI漫剧很有可能成为长剧和短剧退出者选择的“后路”,而AI创作模式将影视创作者和普通人拉到几乎统一起跑线,意味着外部新进入者基数同样不容忽视。无论是资本市场还是文娱行业,对AI漫剧的集体关注都始于8月巨量引擎发布的数据,而资本市场中“AI漫剧”概念的形成,则集中在10月底至11月初,在这一阶段,正是多个平台先后官宣进入“AI漫剧”业务的关键节点。AI漫剧是否会对已有的短剧和更加遥远的长剧产生冲击?

2025-12-05 09:11:36 710

原创 【无标题】2027年,人类最后一次抉择

但问题在于,随着信任度的增加,边界正在模糊。与此同时,Anthropic最新发布(12月3日)的内部深度调查《AI如何改变工作》,正在揭示这场宏大叙事下微观个体的命运——工程师的「空心化」和学徒制的崩溃。在传统的软件工程体系中,初级工程师(Junior)通过处理琐碎的Bug、编写简单的测试用例、维护文档来积累经验,并在资深工程师(Senior)的指导下逐步成长。如果说Kaplan的预测是对未来的宏大叙事,那么Anthropic发布的《AI如何改变工作》报告,则是一份关于当下的、充满血肉真实质感的田野调查。

2025-12-04 09:04:58 992

原创 DeepSeek的小更新,暴打了OpenAI

AlexNet只用了两块GPU。按今天的标准看,那甚至相当于几块GPU的规模,ResNet也一样。前面的大规模预训练,相当于从小学到高二,把所有课本、练习册、卷子全过一遍,这一步大家都差不多,不管是闭源模型,还是开源模型,都在老老实实的念书。通过这修改模型架构,重视后训练,强化 Agent 能力的三板斧,DeepSeek 才终于让自己的新模型,有了能和世界顶尖开源模型再次一战的能力。过去的大模型因为上下文长度有限制,所以在训练的时候都会做一些标注惩罚的工作,如果模型深度思考的内容太长了,那就会扣分。

2025-12-03 10:14:42 707

原创 AI股龙头易主,谷歌动摇OpenAI优势

市场嗅到了一直领先的美国OpenAI的ChatGPT的优势地位发生动摇的可能性。据称与几乎垄断市场的英伟达GPU相比,TPU的成本更低,因此抢夺市场份额的预期加强。10月,英伟达的总市值达到5万亿美元,微软的总市值也达到了4万亿美元。与此形成鲜明对比的是,以此前拉动AI行情的以英伟达为中心的“OpenAI阵营”企业的股价。在对现有赢家的怀疑不断出现的背景下,Alphabet的崛起导致了现在股价的两极分化。如果自主控制机器人和机械的“物理AI”等新领域的成果得到确认,很有可能出现替代Alphabet的主角。

2025-12-02 13:46:09 346

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除