未来已来：智能体核心原理大揭秘；智能体（Agent）的基本工作原理；

云知道AI

于 2024-12-21 00:01:27 发布

阅读量460

点赞数 1

文章标签：机器学习人工智能深度学习自然语言处理语言模型 transformer nlp

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/themillions/article/details/144622160

版权

AI Agent的工作原理，可以总结为以下几个步骤：

1.输入理解：用户提出一个任务（比如发送一份产品对比报告），Agent首先借助大模型对用户输入指令进行理解和解析，识别任务目标和约束条件。

2.任务规划：基于理解的目标，Agent 会规划完成任务的步骤，并决定采取哪些行动。这可能涉及将目标分解成多个子任务，确定任务优先级与执行顺序等（如获取竞品信息、查询企业产品信息、生成对比报告、发送电子邮件）。

3.任务执行与反馈：通过大模型或外部工具完成每个子任务（如调用搜索引擎、查询数据库、生成对比结果、调用电子邮件发送服务）；在此过程中，Agent会搜集与观察子任务结果，及时处理问题，必要时对任务进行调整（如任务执行发生了错误，可能会进行多次迭代尝试）。

4.任务完成与交付：将任务的结果汇总并输出（如生成对比报告与邮件发送回执）。

当然，这只是Agent的核心处理流程。在实际应用中，根据环境与需求的差异，可能存在高度定制且复杂的Agent工作流。

Agent架构

获得广泛认可的Agent架构，来自于OpenAI公司的总结：

可以总结成：

Agent = LLM + 记忆 + 规划技能 + 工具使用

1.大模型：提供核心的语言理解、推理与生成能力，是整个Agent的“大脑”。

2.任务规划：对复杂任务借助大模型进行分解、规划和调度，并及时观察子任务执行的结果与反馈，对任务及时调整。

3.工具使用：与外部工具（如API、数据库、硬件设备）进行交互，扩展智能体的能力，执行任务，相当于Agent的“手脚”。

4.记忆：这是Agent的“存储器”，可用来存储短期的记忆（如一次任务过程中的多次人类交互）或长期记忆（如记录使用者的任务历史、个人信息、兴趣偏好等）。

除此之外，通常Agent还需要提供一个直观的入口，让用户可以方便地给Agent下达指令或查看结果。这个入口，可以是可视化的文字输入、语音输入，或者对外开放的API接口。

曾经在IBM，百度等企业有过10多年AI行业实践的资深人工智能专家高留云提示我们，现在很多B端软件都在加速使用智能体技术在改造优化升级，本文提出的一些产品，在这一波大模型技术兴起之前已经存在行业多年，最近正在加速升级更新，这都得益于AI Agent的强大能力。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。