大模型 Agent

最新推荐文章于 2024-08-20 17:20:07 发布

qq_52234528

最新推荐文章于 2024-08-20 17:20:07 发布

阅读量731

点赞数 27

文章标签：人工智能

本文链接：https://blog.csdn.net/qq_52234528/article/details/139680851

版权

初步介绍

Agent=LLM+记忆+规划技能+工具使用

感知：多模态，深度学习

典型示例：斯坦福小镇

agent记忆

【AI大模型应用开发】以LangChain为例：从短期记忆实战，到如何让AI应用保持长期记忆的探索_recursively summarizing enables long-term dialogue-CSDN博客

【AI大模型应用开发】【LangChain系列】3. 一文了解LangChain的记忆模块（理论实战+细节）_conversationtokenbuffermemory和vectorstoreretriever-CSDN博客

一种简单的短期记忆使用方法：

Memory，通俗的讲，就是记录对话的上下文信息，在有需要的时候补充到用户的提问中去。看上图，简单说下Memory的使用流程：

当用户输入一个问题，首先从Memory中读取相关的上文信息（历史对话信息），然后组装成一个Prompt，调用大模型，大模型的回复作为历史对话信息保存在Memory中，供之后的对话使用。

Agent的长期记忆

Agent的长期记忆_agent 长期记忆-CSDN博客

长期记忆：事实性记忆和程序性记忆

（1）事实性记忆的解决方案：总结、RAG和上下文。

总结：
文本总结：把聊天记录用一小段话总结一下。
指令的方式去访问外部存储：模型把对话中的要点记录到一个叫做bio的本上。
在模型层面用Embedding做总结，比如LongGPT，目前主要是学术界在研究。

RAG：一整套信息检索系统

长上下文：+持久化KV Cache、压缩技术、attention的优化技术。

（2）程序化记忆：prompt、few-shot、微调、Memba和RWKV

（3）一个简单有效的长期记忆解决方案：文本总结+RAG

a.按照一定的窗口分段，然后对每一段聊天记录（+前一段的总结）生成文本总结，放进RAG
b.在分段总结的基础上，再让大模型分别生成分话题的分类总结（放进RAG，这部分搜索排序权重要高于a.）和全局的用户记忆概要（不断更新的全局总结：包括用户基本信息、兴趣爱好和性格特征等）

最终带有长期记忆的大模型的输入：包括角色设定（system prompt）、最近对话、全局记忆概要（即角色对用户的核心记忆 b.2）、经过RAG的聊天记录分段总结（a.）和分类总结（b.1）。

（4）Agent对多人记忆的共享

Agent架构

AI大模型系列之六：基于LLM的Agent架构图解-CSDN博客

在Agent架构设计方面，该论文提出了一个统一的框架，包括Profile模块、Memory模块、Planning模块和Action模块。

Profile模块解析

定义和管理Agent角色的特性和行为。它包含一系列参数和规则，描述了Agent的各种属性，如角色、目标、能力、知识和行为方式等。这些属性决定了Agent如何与环境交互，如何理解和响应任务，以及如何进行决策和规划。

三种Agent角色生成方式，包括LLM生成方法、数据集对齐方法和组合方法。具体如下：

1. LLM生成方法：利用大语言模型自动生成代理的个人特征，比如年龄、性别、个人喜好等背景信息。具体做法是：首先设定代理的组成规则，明确目标人群中代理应具备的属性；然后指定几个手工创建的种子配置文件作为示例；最后利用语言模型生成大量代理配置文件。这种方法可以快速批量生成配置文件，但由于缺乏精确控制，生成的代理可能会缺乏细节。

2. 数据集对齐方法：是从真实世界的人口数据集中获取代理的配置文件信息，比如通过抽取人口调查数据组织成自然语言描述。这样可以使代理行为更真实可信，准确反映真实人口的属性分布。但需要可靠的大规模数据集支持。

3. 组合方法：利用真实数据集生成一部分关键代理，确保反映真实世界规律；然后用LLM生成方法补充大量其他代理，拓展代理数量。这样既保证了代理的真实性，又实现了充足的代理数量，使系统可以模拟更复杂的社会交互。谨慎的配置文件设计是构建有效代理系统的基础。