Agent 概念学习

IT枫斗者

于 2024-10-05 05:15:00 发布

阅读量892

点赞数 20

分类专栏：编程学习 JAVA基础工作中实际总结文章标签： java windows 网络服务器数据库

本文链接：https://blog.csdn.net/Andrew_Chenwq/article/details/142672623

版权

504 篇文章 10 订阅

订阅专栏

423 篇文章 9 订阅

订阅专栏

OpenAI的研究员 Lilian 写过一篇博客:《 LLM Powered Autonomous Agents》，将 Agents 定义为：LLM + memory + planning skills + tool use，即大语言模型、记忆、任务规划、工具使用的集合。
Overview of a LLM-powered autonomous agent system.
大语言模型（LLM）是 Agent 的大脑，要求 Agent 具备以下 3 种能力来配合大脑完成任务：
- 任务规划（planning skills）：对问题进行拆解得到解决路径，既进行任务规划。
- 工具使用（tool use）：评估自己所需的工具，进行工具选择，并生成调用工具请求。
- 记忆（memory）：短期记忆包括工具的返回值，已经完成的推理路径；长期记忆包括可访问的外部长期存储，例如知识库

子目标 & 拆解（Subgoal and decomposition） ：我们处理问题的时候会采用“分治”的思想，将复杂任务拆解成一个个小任务处理。这个在 Agent 的实现中也是一样，一个复杂任务不太可能一次性就能解决的，需要拆分成多个并行或串行的子任务来进行求解，从而提升处理复杂问题的能力。
反思 & 完善（Reflection and refinement） ：Agent 能够对过去的行动决策进行自我反思，完善过去的行动决策和纠正以前的错误来迭代改进。ReAct 提示词技术就是很经典的反思和完善过程。结合 ReAct 提示词技术的 Agent 会在执行下一步action的时候，加上 LLM 自己的思考过程，并将思考过程、执行的工具及参数、执行的结果放到 prompt 中，让 LLM 对当前和先前的任务完成度有更好的反思能力，从而提升模型的问题解决能力。
ReAct 的提示模板，大致格式如下：

Thought: ... 
Action: ... 
Observation: ... 
...(重复以上过程）

尽管大语言模型在预训练阶段学习了大量的知识，但只能够与大模型“纸上谈兵”，它只会说、不会做，同时也不能回答一些如天气，时间之类的简单问题。Agent 对于工具的使用就是弥补大模型只说不做的缺陷。Agent 可以调用外部 API 来获取模型权重中缺失的额外信息，包括当前时间、地理位置信息、代码执行能力、对专有知识库的访问等。

【接收任务】用户提交任务给 Agent。
【组装提示词】Agent 收到用户提交的任务之后，对输入信息进行架构处理合并为最终的 prompt。
【与大模型交互】Agent 将处理后的 prompt 提交给 LLM，拿到下一步需要执行的动作和思考过程。
【循环执行】Agent 会执行 LLM 返回的 Action、观察评估结果、获取下一步 Action。执行的工程中会自主的判断是否需要使用工具来处理 Action 或者获取额外的信息。