未来已来:智能体核心原理大揭秘;智能体(Agent)的基本工作原理;

AI Agent的工作原理,可以总结为以下几个步骤:

图片

1.输入理解:用户提出一个任务(比如发送一份产品对比报告),Agent首先借助大模型对用户输入指令进行理解和解析,识别任务目标和约束条件。

2.任务规划:基于理解的目标,Agent 会规划完成任务的步骤,并决定采取哪些行动。这可能涉及将目标分解成多个子任务,确定任务优先级与执行顺序等(如获取竞品信息、查询企业产品信息、生成对比报告、发送电子邮件)。

3.任务执行与反馈:通过大模型或外部工具完成每个子任务(如调用搜索引擎、查询数据库、生成对比结果、调用电子邮件发送服务);在此过程中,Agent会搜集与观察子任务结果,及时处理问题,必要时对任务进行调整(如任务执行发生了错误,可能会进行多次迭代尝试)。

4.任务完成与交付:将任务的结果汇总并输出(如生成对比报告与邮件发送回执)。

当然,这只是Agent的核心处理流程。在实际应用中,根据环境与需求的差异,可能存在高度定制且复杂的Agent工作流。

Agent架构

获得广泛认可的Agent架构,来自于OpenAI公司的总结:

图片

可以总结成:

Agent = LLM + 记忆 + 规划技能 + 工具使用

1.大模型:提供核心的语言理解、推理与生成能力,是整个Agent的“大脑”。

2.任务规划:对复杂任务借助大模型进行分解、规划和调度,并及时观察子任务执行的结果与反馈,对任务及时调整。

3.工具使用:与外部工具(如API、数据库、硬件设备)进行交互,扩展智能体的能力,执行任务,相当于Agent的“手脚”。

4.记忆:这是Agent的“存储器”,可用来存储短期的记忆(如一次任务过程中的多次人类交互)或长期记忆(如记录使用者的任务历史、个人信息、兴趣偏好等)。

除此之外,通常Agent还需要提供一个直观的入口,让用户可以方便地给Agent下达指令或查看结果。这个入口,可以是可视化的文字输入、语音输入,或者对外开放的API接口。

曾经在IBM,百度等企业有过10多年AI行业实践的资深人工智能专家高留云提示我们,现在很多B端软件都在加速使用智能体技术在改造优化升级,本文提出的一些产品,在这一波大模型技术兴起之前已经存在行业多年,最近正在加速升级更新,这都得益于AI Agent的强大能力。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值