模型即产品:一场被低估的AI Agent革命正在发生

本文核心观点:

  1. 当前所有AI Native产品其实都是AI Agent,AI应用是基于LLM + workflow构建而成。
  2. 真正的AI Agent应当是LLM内部具备推理、规划、记忆和调用工具的能力,而非通过外部workflow实现。
  3. LLM能力越强,越能取代LLM + workflow的应用,DeepSeek的崛起已经对很多AI产品形成了能力覆盖,即不需要构建复杂的工作流就能完成特定场景的任务。
  4. 以OpenAI为代表的闭源大模型公司都转变为Agent公司,不再以出售API而是Agent服务盈利。

2024年2月,瑞典金融公司Klarna的客服中心发生了一件怪事:原本需要700名员工处理的客户聊天,突然被一个「看不见的员工」接管了三分之二。这个名为「AI Agent」的数字员工,用30天时间完成了人类需要半年的适应期——它不仅能精准识别用户情绪,还会根据实时政策调整话术,甚至在发现系统漏洞时主动触发工单。更关键的是,它从未调用过外部工作流引擎。

这场静悄悄的革命,撕开了AI应用的「皇帝新衣」:那些被称作「AI原生」的产品,本质上仍是LLM套着RPA的壳在跳舞。而真正的AI Agent,正在学会像人类一样思考——用大脑(LLM)而非拐杖(外部流程)完成任务。

一、被误解的「AI原生」:当LLM沦为流程打工仔

今天打开任意一个AI助手,背后都藏着一套复杂的「提线木偶」系统:用户输入→意图分类→调用API→执行动作→返回结果。这套诞生于2023年代的「LLM+workflow」架构,本质上是让大模型扮演「人肉API调用器」。就像咖啡厅的新手学徒,虽然记住了所有配方,但每做一杯咖啡都要翻笔记本确认步骤。

某知名智能客服的代码库里,光是意图分类的规则就有1.2万条,每个对话节点都牵着数十个API接口。讽刺的是,当用户问「如何给老人预约疫苗」时,系统需要先调用地理位置API,再跳转医疗系统接口,最后生成话术——而这一切,本可以通过LLM的「常识推理+多轮记忆」能力直接完成。

腾讯研究院的调研显示,83%的企业AI项目存在「流程冗余」:明明大模型能理解「帮用户查询逾期账单并生成还款计划」,却非要拆分成12个独立API调用。这不是技术限制,而是思维惯性——就像自动挡汽车普及后,仍有人坚持左脚踩离合。

二、DeepSeek:当LLM开始「内生智能」

2025年1月20日发布的DeepSeek-R1模型,给出了另一种可能。在测试中,它无需外部工具链,直接完成了「策划一场跨城求婚」的复杂任务:首先根据用户提供的聊天记录推断女友的喜好(记忆),接着分析天气和场地可用性(推理),然后规划出「公园野餐→无人机灯光秀→密室惊喜」的路线(规划),最后甚至自动生成了应急方案(备用室内场地)。整个过程,模型只用了3次自洽的思考链。

这种能力的本质,是LLM正在发育出「认知操作系统」。就像人类大脑的前额叶皮层,新一代模型开始内置:

  • 记忆宫殿:在对话中自动建立上下文索引,比如记住用户3天前提到的「母亲对花粉过敏」
  • 决策树生成器:面对「帮用户投诉快递破损」时,自动枚举「联系客服→拍照取证→申请赔偿」的优先级
  • 工具直觉:需要调用地图时不再依赖固定API,而是通过自然语言描述「查一下深圳湾公园的开放时间」

百度「橙篇」的技术负责人透露,他们的长文生成模型已实现「零工作流」创作:输入「新能源汽车电池回收的困境」,模型会自动完成文献检索(内置学术知识库)、数据对比(历史报告记忆)、逻辑框架搭建(因果推理),最终输出8000字深度分析——这在传统架构下需要至少5个工具协同。

三、OpenAI的「转变」:从卖API到卖「数字员工」

根据2025年3月13日的报道,OpenAI推出全新的Responses API,明确定位为“Agent的构建模块”,支持搜索、文件查阅、本地任务执行等多步操作。与传统Chat Completion按“输入/输出 token”计费不同,Responses API首次提出“按工具调用和任务结果计费”。这背后,是Klarna案例的大规模复制——当Agent能直接交付业务结果(如处理70%的客服咨询),企业愿意为「价值」而非「算力」买单。

投资机构a16z的观察更犀利:下一代销售系统的核心,不再是CRM里的静态数据,而是能「理解客户情绪、预判需求、自动生成跟进策略」的Agent。某头部车企的试驾预约系统已证明:内置LLM推理的Agent,比传统流程式客服的转化率提升42%,因为它会在用户犹豫时,自动调用历史对话中的「家庭用户更在意安全」的记忆点。

这种转变正在重构AI产业生态。曾经靠卖RPA工具发财的厂商,突然发现客户开始问:「你们的流程能不能用DeepSeek的模型替代?」就像智能手机淘汰MP3时,没有人是无辜的。

四、Agent的终极形态:当AI学会「自己写剧本」

想象一个无需预设流程的法务Agent:当收到合同违约通知时,它会先分析条款(内置法律知识库),接着调取客户历史履约记录(记忆),然后判断协商/仲裁的胜率(推理),最后自动生成律师函并同步证据链。整个过程没有人工干预,没有固定API,只有模型内部的「思考-决策-行动」闭环。

这种「内生智能」的进化,正在改写AI应用的三个底层逻辑:

  1. 从「流程驱动」到「目标驱动」:Agent只关心「如何帮用户解决问题」,而非「下一步该调用哪个接口」
  2. 从「被动执行」到「主动规划」:就像优秀的助理会预判会议需要的资料,Agent会在用户提问前准备好备选方案
  3. 从「工具集合」到「认知主体」:当模型能自主调用插件(如用自然语言「查天气」替代固定API),外部工作流将失去存在意义

微软研究院的最新实验显示,具备内生规划能力的Agent,在复杂任务处理上的效率是传统架构的3.2倍,错误率下降67%。这不是简单的技术迭代,而是AI从「自动化工具」到「智能主体」的质变。

五、AI Agent的寒武纪大爆发

回到Klarna的案例,那个「看不见的员工」正在揭示未来:当LLM真正学会思考,所有需要「按步骤操作」的工作流都将消失。就像人类不需要「先迈左脚再迈右脚」的走路指南,强大的AI Agent会自己走出最优路径。

现在,DeepSeek的模型已经能在金融、法律、教育等领域实现「零工作流」落地,OpenAI的Agent服务正在重构企业付费逻辑,百度的「橙篇」则证明长链创作无需外部流程。这场革命没有硝烟,但每个从业者都能闻到变革的味道——当AI开始自己写剧本,那些还在画流程图的人,注定会被时代的洪流裹挟着向前。

或许正如某位工程师的调侃:「以前我们教AI『怎么做』,现在要开始问它『怎么想』了。」而这,正是智能时代最激动人心的转折点。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

老A的AI实验室

给博主点一杯卡布奇诺

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值