从实验室到商业前沿:AI代理如何驱动万亿级商业变革?

根据硅谷科技评论(svtr.ai)创投库,在全球17个AI应用赛道里,63家AI代理初创企业获得知名机构投资,融资总额超过11亿美金。AI代理领域已经成为硅谷投资机构和创业公司关注的重点。

从去年11月开始,我们多次介绍该领域的创投前沿动态,包括垂类AI代理爆发:创始人该如何站上3000亿美元的风口? 伯克利天空计算实验室(Sky Lab)的孵化项目[Letta提出的AI代理技术栈市场地图];[硅谷老牌基金对AI 代理行业的系统性梳理]。此外还介绍了三家AI代理领域的高潜创业公司[Hippocratic AI]。

Insight Partners,1995年成立的全球性一级市场投资机构,以42起AI投资案例在AI机构排行榜排名第11位。这家机构在今年5月探讨[人工智能代理(AI Agent)正在颠覆自动化],11月提出[人工智能优先应用的万亿美元市场机会]。今天,我们一起看看这家机构对AI代理行业的判断和理解。

在人工智能快速发展的浪潮中,AI代理(Agent)已经从实验室概念走向了实际应用的前沿。然而,不同企业在部署AI代理时,面临的挑战和选择并不一致。我们观察到,用例的复杂性和业务场景的多样性,正在推动企业在“外购”与“定制”之间权衡。而对于AI代理价值的判断,也逐渐成为企业战略决策的核心问题。

为了更全面地理解这一领域的现状,我们与行业一线从业者进行了深入交流,从开发者到企业领导者,从最终用户到学术研究人员。通过这些对话和调查,我们对已经投入应用的典型案例进行探讨,并总结部署过程中的关键经验和教训。

一、AI代理生态系统现状

关于AI代理的定义,学术界普遍认为它是可以独立推理并采取行动的软件。这种定义展现了AI代理的核心愿景——结合应用逻辑和工作流自动化,将LLM(大语言模型)嵌入复杂任务的计划和执行中,形成统一的架构。

AI代理可以简单到仅完成单一任务,例如结合LLM与特定工具;也可以复杂到由多个代理组成的平台,通过分解任务为模块化代理,协调执行以完成复杂工作流。

1、AI代理的设计考量

构建AI代理的核心是对任务和用户体验的深刻理解。虽然LLM是架构的关键部分,但开发者通常会结合基础模型与标准应用组件、数据与工具集成以及API接口。以下是我们从实践中总结的两个关键经验和设计权衡:

(1) 用户参与整个代理生命周期的开发

为了让代理超越实验阶段,开发者采用了与用户密切协作的方式,从设计到部署再到生产环境的扩展。以下是一些最佳实践:

  • 了解用户工作流程:通过分析用户工作轨迹,设计多样化的训练示例和奖励函数,以优化代理性能和任务规划。

  • 集成与数据架构:明确所需的集成工具和用户数据架构,以使代理的行为更加贴合实际需求。

  • 用户评估与反馈机制:开发良好的用户评估、错误处理和反馈机制,用于训练和微调代理输出。

  • 优化用户体验:特别是在面向客户的应用中,调整输出格式和语气以匹配用户期望。

  • 构建信任:通过生成审计轨迹和自动化工件来满足合规性需求。

  • 心理与技术接受:获得用户及组织的心理认同与技术支持。

(2)任务规划(推理能力)

将用户输入翻译为任务计划是设计中的关键。一些方法允许用户定义明确的控制流程,而另一些方法则交由LLM自主规划。例如,“Chain of Thought”推理模型结合了强化学习和路径选择,可在推理时提高任务设计的效率。

  • 简单工作流:通过序列化任务,LLM可以记忆并通过反馈循环微调模型。

  • 复杂工作流:需要多代理方法,比如编码执行图LangGraph或多代理协调工具CrewAI,提供如下功能:

  • 连接工具、API和数据源以构建代理。

  • 协调任务流和代理交互,确保流程清晰并维护状态。

  • 提供反馈循环和可定制的用户体验以优化代理性能。

2、企业代理的参考架构

(1)数据检索

根据具体用例,数据检索有多种选择:

  • 检索增强生成(RAG):通过检索和整合私有与公共数据集,让LLM回答更具背景性。比如,Llamaindex可以构建简单代理的RAG管道。

  • 记忆能力:结合LLM的语义记忆、情节记忆和长期记忆,可为代理提供个性化和适应性。

  • 长上下文窗口:更大的上下文窗口使代理能够更好地理解多步推理任务,这对于长时间任务和多模态输入尤为重要。

(2)代理计算接口

通过连接各种数据源和外部工具,简化代理设计并增强其能力:

  • 功能/工具调用:LLM可以调用API、查询数据库、操作文件或执行代码,从而增强其能力。

  • 计算机使用:LLM可以通过限制操作空间(如Bash命令)快速实现任务,但复杂任务可能需要API驱动以实现更高的一致性。

  • 集成工具:例如Workato的API集成工具或Langchain等中间件,支持代理与相关数据源及应用的连接。

(3)性能与评估
  • 评估机制:采用端到端的反馈反思循环,对输出的准确性进行测试。可以通过分解中间步骤和记录错误信息来改进训练。

  • 保护机制:通过AWS等工具设置功能边界,确保代理符合公司政策并限制权限。

3、代理类型

(1)垂类代理

专注于解决特定领域的任务,例如法律(Harvey)或客户服务(Sierra)。其定价模式通常为“代理即服务”或基于结果的定价。

(2)横向平台

这些平台整合了通用数据源、工具、用户体验和保护机制,支持构建不同工作流的代理。Cohere企业平台是一个典型例子。

(3)多模态代理

专注于处理多模态工作流,例如视频生成、语音聊天等。随着多模态模型的进步,这类代理正逐渐趋向于使用自然界面的交互方式。

(4)传统SaaS代理接口

许多传统SaaS平台正在添加代理覆盖层,以优化用户的工作流。例如,Agentforce通过在现有系统中集成代理功能来释放更多价值。

二、AI代理市场版图

AI代理市场可以划分为两大关键领域,这些领域在未来有巨大的发展机会:

1、基础设施

为了让AI代理在生产环境中可靠地部署,必须构建完善的框架和基础设施。基础设施开发者专注于改进代理的运行可靠性、集成能力以及生产环境中的扩展性。这包括用于构建代理的开发工具、数据管理解决方案和跨系统的兼容性增强。

2、垂直化平台

垂直化功能代理是另一个关键机会领域。这类代理通过与复杂工作流结合,专注于特定行业或功能领域,提供针对性的解决方案。以下特点的行业尤其适合垂直化代理的发展:

  • 技术复杂性高:需要处理技术要求高、复杂的任务。

  • 数据源独特:行业特有数据可以为代理提供独特的背景。

  • 创新不足的传统行业:在技术创新方面相对滞后的行业,面临被垂直化代理颠覆的可能性。

通过为这些垂直领域预先设计代理工作流,企业更可能选择购买现成的代理解决方案,而非自建系统。

尽管AI代理市场呈现快速发展的趋势,但仍有以下两个关键问题尚未解决:

  • 传统企业与新兴企业的竞争焦点。已有的行业经验和用户基础为传统企业提供了天然优势。它们可以通过扩展现有产品功能,逐步引入代理解决方案。创业公司应聚焦于细分市场的创新,尤其是传统企业难以迅速响应的领域,例如高技术门槛或需要快速迭代的场景。

  • 基础设施堆栈的整合。基础设施的哪些部分会被模型提供商(如OpenAI、Anthropic)直接整合,哪些部分会成为独立市场,也是一个值得关注的动态。例如,当前的工具链(如Langchain、Workato)可能会逐步被整合到统一的平台中。

三、AI代理的实际应用

1、企业实际应用案例

过去一年,许多AI代理应用从概念阶段走向现实,各行业的成熟度各不相同。对105家财富500强企业的调研显示,AI代理在不同阶段的部署涵盖了从基于规则的简单任务(如总结和审批)到复杂多代理系统的任务(如税务规划、供应链优化和基金管理)。

以下是一些实际应用案例,按“外购”(externally)、“实验”(experiment)和“生产”(production)三个类别进行划分。

(1)开发者相关应用(SDLC)

AI代理正在增强软件开发生命周期(SDLC)的工作流,包括代码生成、端到端测试、基础设施部署、审批合规及可观察性。

  • 身份访问管理(生产):某资产管理公司使用AI代理自动化复杂的身份访问管理(IAM)和基础设施即代码(IaC)工作流,协调AWS、微软云和本地环境的任务规划代理,节省开发者数小时重复性工作。

  • 自动化测试与部署(生产):一家全球控股公司通过AI代理自动生成用户故事、测试用例以及虚拟机设置和部署管理,降低DevOps和TPM团队的负担。

  • 代码生成与合规(生产):某大型银行使用AI代理进行代码注释、单元测试和数据模型验证,减少错误,提高质量。

  • AT&T的软件开发AI(生产):AT&T采用自主代理,自动化用户故事创建、编码和测试执行,同时让开发者专注于复杂问题。

(2)客户体验

AI代理在客户体验中,通过个性化服务和无缝互动提升品牌体验。

  • 零售顾问培训(实验):一家美容零售商使用AI代理培训门店员工,建立知识平台,提高产品知识与客户服务水平。

  • 产品发现与协助(实验):某零售巨头在客户旅程中部署AI代理,从产品发现到售后支持。

  • 礼品推荐(实验):节日期间试点AI代理,根据顾客偏好推荐礼品。

  • 客户服务AI代理(外购):某客服解决方案供应商利用AI代理简化工作流,实时完成文档、审批等任务。

  • 保险贷款AI销售代理(外购):一家欧盟银行使用语音AI代理,通过个性化交互提升贷款保险产品转化率。

(3)后台运营(财务与采购)

AI代理通过自动化流程改善后台运营。

  • 供应链库存与分流(生产):某消费品公司利用AI代理监控库存,触发补货订单,防止断货。

  • 自动化发票处理(生产):AI代理提高发票处理效率,减少手动任务。

  • 研究与文件分析(生产):某投资银行通过AI代理阅读非结构化文档,进行投资分析。

  • 股票行为预测(实验):金融交易所利用AI预测股票行为,为交易决策提供支持。

(4)数据分析

AI代理通过管理和分析数据,提高数据密集型工作流的效率。

  • 云使用分析(实验):某工业解决方案公司通过AI代理检测云使用中的异常并建议优化。

  • 文本到SQL转换(生产):某电信公司利用多代理系统将自然语言查询转化为SQL。

  • 合规驱动的数据查询(生产):某金融服务公司使用AI代理执行数据查询与合规检查。

(5)运营支持

AI代理通过自动化流程加速关键任务并提高质量。

  • 自动化网络诊断(生产):某电信公司使用AI代理检测网络问题并实时报警。

  • 执行报告与知识检索(生产):某投资银行通过AI代理生成月度高管报告,提高决策效率。

2、短期挑战与最佳实践

(1)数据合规性

AI代理在数据敏感行业面临合规挑战。企业需遵循数据主权法规、数据治理和医疗合规要求。例如:

  • 数据主权:欧盟电信公司通过本地模型满足法规要求,但牺牲了部分准确性。

  • 数据治理:某全球客服公司通过严格的PII匿名化协议保障数据安全。

  • 医疗合规:某美容品牌通过非处方性建议避免法律风险。

(2)数据准备与文档化

高质量、标准化的数据对于AI成功至关重要。企业正在投资于现代化数据堆栈和数据整理岗位以提高AI适应性。

(3)输出可靠性

可靠性对于客户角色至关重要。最佳实践包括:

  • 可追溯性:推荐附加引用来源。

  • 人机协作:高风险输出需人工审查。

  • 实时监控:利用监控工具快速检测问题。

(4)企业ROI评估

衡量AI代理的ROI对推广至关重要。企业正在制定框架,比较AI性能与人类基准。

(5)克服文化阻力

透明沟通与员工参与可以缓解对AI取代工作的担忧。

3、自建与外购的决策考量

(1)需求的紧迫程度

由于AI代理仍处于早期阶段,有限的供应商选择增加了决策复杂性。外购通常更快,但内部构建可能更适合个性化需求。

(2)内部团队技术实力

工程实力强的公司倾向于优先自建,而资源有限的公司更依赖外购。

(3)数据隐私监管要求

在受监管行业,自建更常见,而零售等领域更倾向于外购。

四、AI代理的定价经济学

硅谷科技评论(SVTR)编者按:我们之前也讨论过[AI原生公司的定价策略],我们也发现越来越多的AI公司开始采用基于效果/结果定价。

1、从SaaS到AI代理:定价模式的演变
  • 2000年代:Salesforce通过基于订阅的SaaS模式改变了软件定价,将固定许可证模式替换为与客户成功挂钩的可扩展、循环计费模式。

  • 2010年代:移动计算与产品驱动增长(PLG)推动了基于使用量的定价模式,如Snowflake的按数据存储收费。

  • AI代理时代:转向基于结果的定价,将价值与可量化结果挂钩。

2、AI代理的新兴定价模型

通过与企业高管和创始人的交流,我们总结了三种塑造AI代理未来的关键定价模式:

(1)平台费 + “雇佣”代理

  • 模型:基础平台费加上按工作量收费,就像雇佣全职员工。

  • 示例:Cognition的Devin按AI软件开发者收费,包含基础费用以及超出工作单元限额的额外费用。

(2)平台费 + 基于结果的定价

  • 模型:平台费用与特定成果挂钩的收费相结合。

  • 示例:用于呼叫中心的AI代理收取基础费用外,还按成功完成客户入职的结果收费。

(3)纯基于结果的定价

  • 模型:企业仅为实现的业务结果付费。

  • 应用:适用于高量使用场景,如销售开发、内容生成或采购,这些场景能够显著替代运营成本(OpEx)。

3、初创企业的挑战

初创企业在AI代理的商业化过程中面临诸多障碍,包括价值定义、定价策略及可扩展基础设施建设:

  • 价值交付不成熟。部分AI代理仅完成简单或部分任务,限制了其感知价值和变现潜力。

  • 定价模型不确定性。未明确的价值交付增加了定价策略的不确定性,降低灵活性。

  • 定价过高的风险。限制的交付价值和客户怀疑态度限制了可接受价格,高定价会阻碍采用。

  • 系统不完整。初创企业通常缺乏规模化使用的计量、评级和变现基础设施,需投入可扩展解决方案。

4、大型企业的挑战

企业在采用和预算AI代理时同样面临难题:

  • 不明确的ROI。对于AI代理的可量化收益缺乏信心,阻碍企业投入。

  • 复杂的定价模型。验证成果和新型指标(如执行次数或提示数)增加了采购团队的不确定性。

  • 成本预测难度。CFO对变量定价模式抵触,因其难以预测和适应。

  • 采购流程转变。AI定价需要与财务负责人提前接洽,以将采购与业务成果对齐。

  • 安全与合规。尤其在受监管行业,安全风险影响AI代理的采用速度。

5、AI代理定价最佳实践

无论是基于结果、基于使用量还是混合模式,分阶段推进策略对于未来12到18个月的长期收入增长至关重要:

  • 起步阶段:在现有计划中引入有限使用,并收取合理的较高平台费,以避免增加复杂的采购决策难度。

  • 逐步转向:随着价值交付的实现,逐步将总价更高比例转向基于使用量或成果的定价。

  • 基础设施:投资于跟踪成果并将指标集成到计费系统中,对于确保可靠的定价模式至关重要。

  • 财务预期:通过与财务领导层的早期接洽,将AI代理的成果与企业的关键绩效指标(KPI)对齐。

如何学习大模型 AI ?

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

  • 大模型 AI 能干什么?
  • 大模型是怎样获得「智能」的?
  • 用好 AI 的核心心法
  • 大模型应用业务架构
  • 大模型应用技术架构
  • 代码示例:向 GPT-3.5 灌入新知识
  • 提示工程的意义和核心思想
  • Prompt 典型构成
  • 指令调优方法论
  • 思维链和思维树
  • Prompt 攻击和防范

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

  • 为什么要做 RAG
  • 搭建一个简单的 ChatPDF
  • 检索的基础概念
  • 什么是向量表示(Embeddings)
  • 向量数据库与向量检索
  • 基于向量检索的 RAG
  • 搭建 RAG 系统的扩展知识
  • 混合检索与 RAG-Fusion 简介
  • 向量模型本地部署

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

  • 为什么要做 RAG
  • 什么是模型
  • 什么是模型训练
  • 求解器 & 损失函数简介
  • 小实验2:手写一个简单的神经网络并训练它
  • 什么是训练/预训练/微调/轻量化微调
  • Transformer结构简介
  • 轻量化微调
  • 实验数据集的构建

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

  • 硬件选型
  • 带你了解全球大模型
  • 使用国产大模型服务
  • 搭建 OpenAI 代理
  • 热身:基于阿里云 PAI 部署 Stable Diffusion
  • 在本地计算机运行大模型
  • 大模型的私有化部署
  • 基于 vLLM 部署大模型
  • 案例:如何优雅地在阿里云私有部署开源大模型
  • 部署一套开源 LLM 项目
  • 内容安全
  • 互联网信息服务算法备案

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值