一文读懂大模型 Agent 架构，详解Profile，Memory，Planning，Action模块作用

最新推荐文章于 2025-03-20 10:51:35 发布

机器学习社区

最新推荐文章于 2025-03-20 10:51:35 发布

阅读量8.9k

点赞数 30

分类专栏：大模型文章标签：架构人工智能大模型 LLM

本文链接：https://blog.csdn.net/m0_59596990/article/details/135717263

版权

大模型专栏收录该内容

261 篇文章

订阅专栏

在人工智能领域，人们对Agent的期待日益增长。每当基于Agent的新开源工具或产品出现时，都能引发热烈的讨论，比如之前的AutoGPT。

对于对Agent感兴趣的朋友们，我推荐一篇论文，它全面地介绍了Agent的架构，对于理解Agent的全局有着重要的价值。

https://browse.arxiv.org/pdf/2308.11432.pdf

这篇论文详细解读了Agent的概念、发展历史以及近期的研究热点。除了这些基础知识，我认为最有价值的部分在于，它总结了基于大型语言模型（LLM）的Agent的架构，使我们能够按照一定的标准范式去设计自己的Agent。

我这篇文章主要从两个关键方面来阐述基于LLM的Agent的构建策略：设计Agent架构以更好地发挥LLM的能力，以及如何赋予Agent完成不同任务的能力。

在Agent架构设计方面，该论文提出了一个统一的框架，包括Profile模块、Memory模块、Planning模块和Action模块。

Profile模块：

定义和管理Agent角色的特性和行为。它包含一系列参数和规则，描述了Agent的各种属性，如角色、目标、能力、知识和行为方式等。这些属性决定了Agent如何与环境交互，如何理解和响应任务，以及如何进行决策和规划。这个模块提出了三种Agent角色生成方式，包括LLM生成方法、数据集对齐方法和组合方法。

1. LLM生成方法：利用大语言模型自动生成代理的个人特征，比如年龄、性别、个人喜好等背景信息。具体做法是：首先设定代理的组成规则，明确目标人群中代理应具备的属性；然后指定几个手工创建的种子配置文件作为示例；最后利用语言模型生成大量代理配置文件。这种方法可以快速批量生成配置文件，但由于缺乏精确控制，生成的代理可能会缺乏细节。

2. 数据集对齐方法：是从真实世界的人口数据集中获取代理的配置文件信息，比如通过抽取人口调查数据组织成自然语言描述。这样可以使代理行为更真实可信，准确反映真实人口的属性分布。但需要可靠的大规模数据集支持。

3. 组合方法：利用真实数据集生成一部分关键代理，确保反映真实世界规律；然后用LLM生成方法补充大量其他代理，拓展代理数量。这样既保证了代理的真实性，又实现了充足的代理数量，使系统可以模拟更复杂的社会交互。谨慎的配置文件设计是构建有效代理系统的基础。

Memory模块：

在Agent系统中扮演重要角色，它存储和组织从环境中获取的信息，以指导未来行动。

结构上，内存模块通常包含短期记忆和长期记忆两个部分。短期记忆暂存最近的感知，长期记忆存储重要信息供随时检索。

格式上，内存信息可以用自然语言表达，也可以编码为向量嵌入提高检索效率。还可以利用数据库存储，或组织为结构化列表表示内存语义。

操作上，主要通过记忆读取、写入和反射三种机制与环境交互。读取提取相关信息指导行动，写入存储重要信息，反射总结见解提升抽象水平。

Planning模块：