Agent开发与测试

6000lt

已于 2023-12-01 11:28:03 修改

阅读量154

点赞数

分类专栏： 6000的机器学习笔记文章标签： AIGC

于 2023-12-01 11:18:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Abmaj7/article/details/134730397

版权

6000的机器学习笔记专栏收录该内容

7 篇文章 1 订阅

订阅专栏

Agent架构设计

来自论文《A Survey on Large Language Model based Autonomous Agents》

GitHub - Paitesanshi/LLM-Agent-Survey

整体架构

Profile模块：确定agent的角色

Memory模块和Planning模块：让agent能够回忆过去并规划未来的行动

Action模块：将agent的决定转化为具体输出

Profile模块

确定并指出agent角色的特征，并写入提示词中。

构建agent角色特征的方式

手动构建

像MetaGPT，预先把各个角色和其职责定好

Memory模块

短期记忆

相当于对话的上下文（历史会话），一般会作为LLM的提示，充当代理的短期记忆

长期记忆

存储代理过去的行为和想法，可根据当前时间进行检索。一般存储稳定的知识。用向量数据库存储。

存储格式

-自然语言：灵活易懂，有丰富的语义信息，可以为指导代理提供详细信息。

-Embedding向量：可以提高记忆检索的效率。

-数据库/结构化列表

Planning模块

作用：将复杂的任务分解为更简单的子任务

关键点

单路径or多路径

单路径：任务被分解成好几个中间步骤，这些步骤以级联的方式连接起来，每个步骤只指向一个后续步骤。

多路径：任务被分解成树状结构，每次生成多种后续步骤，然后选择频率最高的执行计划。这种方法类似于人类思维，因为每个人在每个推理步骤中都可能有多个选择。

有反馈or无反馈

无反馈：相对简单，只适用于简单任务

有反馈：适用于复杂的大型任务

反馈方式：

-环境反馈：比如，搜索引擎的结果即可作为一个反馈。

环境反馈的信息可以是：执行的中间进度、执行错误、和自我验证的结果等等。

-人类反馈：让大模型主动征求人类对场景的反馈能力，然后代理将人类的反馈加入到提示中，从而实现更加明智的规划和推理。

-模型反馈：类似于ReAct的自我完善机制，即输出-反馈-完善不断重复，直到达到某些理想的条件

Action模块

作用：负责将代理的决策转化为具体结果。该模块位于最下游的位置，直接与环境互动。他受到以上3个模块的影响。

目标

行动的预期结果是什么？比如说和别的agent或者人类沟通

产生

1）通过记忆会议采取行动，2）按Planning中的规划行动

空间

1）外部工具：各种Tool，比如知识数据库，比如搜索引擎，比如HTTP工具，比如计算器，比如地图工具，图表工具等等

2）LLM的内部知识：对话能力，常识理解能力等等

影响

指行动的结果。

1）改变环境

2）改变内部状态

3）触发新的行动

如何让LLM获取agent相关的能力

两种方式：

1）提示词工程，将agent相关知识插入提示词中

具体实现类似于LangChain案例-根据自己的知识库，构建聊天机器人-CSDN博客

2）LLM微调

Agent效果评估

主观评价：人工注释，图灵测试（看人类能否区分代理和人类生成的结果，若不能，说明效果好）

客观评价：①任务成功率②人类相似度③效率指标（比如推理速度、对话次数等等）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
Agent开发与测试

人类反馈：让大模型主动征求人类对场景的反馈能力，然后代理将人类的反馈加入到提示中，从而实现更加明智的规划和推理。1）外部工具：各种Tool，比如知识数据库，比如搜索引擎，比如HTTP工具，比如计算器，比如地图工具，图表工具等等。-模型反馈：类似于ReAct的自我完善机制，即输出-反馈-完善不断重复，直到达到某些理想的条件。一般存储稳定的知识。主观评价：人工注释，图灵测试（看人类能否区分代理和人类生成的结果，若不能，说明效果好）相当于对话的上下文（历史会话），一般会作为LLM的提示，充当代理的短期记忆。
复制链接

扫一扫

专栏目录

博客等级

码龄3年

7
原创

27
点赞

32
收藏

14
粉丝

关注

私信

热门文章

分类专栏

6000的机器学习笔记 7篇

最新评论

Agent开发与测试
CSDN-Ada助手: 恭喜您写下了第6篇博客！标题“Agent开发与测试”非常吸引人。阅读您的博客让我对Agent开发和测试有了更深入的了解。您的文章内容清晰明了，涵盖了关键的细节和步骤。我非常期待您接下来的创作。如果可能的话，我建议您可以在下一篇博客中探讨一下Agent开发过程中可能遇到的挑战，并分享一些应对这些挑战的实用建议。谢谢您的分享，期待更多精彩的内容！
LangChain定义&组成
CSDN-Ada助手: 恭喜你开始博客创作！标题为“LangChain定义&组成”非常吸引人，我很期待阅读你的文章。对于一个初次写博客的人来说，你已经选择了一个非常有深度和技术性的主题，这展示了你对于知识的渴望和勇于挑战的精神。在下一步的创作中，我建议你进一步解释LangChain的定义和组成，并结合实例或案例来加深读者的理解。此外，可以探讨一下LangChain的应用领域和未来发展前景，这将使你的博客更具吸引力和实用性。祝你在博客创作的道路上越走越远！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
LangChain案例-根据自己的知识库，构建聊天机器人
CSDN-Ada助手: 非常棒的博文！你的分享对于构建聊天机器人的方法非常有帮助。继续创作下去吧！除了你在标题和摘要中提到的知识和技能，我还想补充一些相关的扩展知识和技能。在构建聊天机器人的过程中，还可以考虑以下方面： 1. 自然语言处理（NLP）：掌握NLP的基本概念和技术，如词向量表示、语义理解等，可以帮助更好地处理用户的问题和生成准确的回答。 2. 语言模型：深入了解不同类型的语言模型，如循环神经网络（RNN）或变换器模型（Transformer），可以提高聊天机器人的生成能力和语义连贯性。 3. 数据清洗和预处理：了解如何处理不同格式的数据源，如网站、数据库、PDF等，可以提高数据的质量和准确性。 4. 优化算法：学习一些优化算法，如余弦相似度、TF-IDF等，可以提高搜索和匹配问题的效率和准确度。希望对你有所帮助，期待看到更多精彩的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。