任务一:初始大模型与Agent
LLM-based Agent 基本原理和组成
【1】brain:信息记忆和处理。通过自然语言交互,理解人类意图和目标,从语义信息中提出出知识,语言知识、常识知识、专业领域知识,然后通过特定的记忆机制,保存历史记录的长度和提取相关记忆的难度,需要总结和利用数据结构压缩存储。当检索和提取记忆时,可以根据不同的指标如重要性、相关性和最近性来进行设计。对于记忆的使用包括推理和规划,迁移泛化等方式 (in-context learning, continual leanring, multi-task learning)
【2】perception:感知。根据LLM 选择的不同,如果是VLM,还可以支持不同模态的输入
【3】action:输出文字,控制行为,使用其他工具
使用场景
【1】single agent:reasoning, planning
【2】multi-agent:合作(无序、有序),对抗(辩论)
【3】human-agent collaboration: