【学习笔记】博客Lilian Weng - LLM Powered Autonomous Agents

原博链接:https://lilianweng.github.io/posts/2023-06-23-agent/

  1. Agent关键组件
    在这里插入图片描述

(1) 规划(Planning)

  • 任务分解
  • 自我反思:纠正以前错误,迭代改进
    • ReAct (Yao et al. 2023)将动作空间扩展为特定于任务的离散动作和语言空间的组合
    • Reflexion (Shinn & Labash 2023)是一个为Agent提供动态记忆和自我反思能力以提高推理能力的框架
    • Chain of Hindsight (CoH; Liu et al. 2023)鼓励模型通过显式地呈现一系列过去的输出来改进自己的输出,每个输出都有反馈注释

(2) 记忆(Memory)

  • 人脑中的记忆类型:感觉记忆、短期记忆、长期记忆
    在这里插入图片描述

    外部记忆可以缓解注意力持续时间有限的限制。标准做法是将信息的嵌入表示保存到支持快速最大内积搜索(MIPS)的矢量存储数据库中。为了优化检索速度,通常的选择是近似最近邻(ANN)算法

(3) 工具使用(Tool use)

  1. 挑战
  • 有限的上下文长度
  • 长期计划和任务分解中的挑战
  • 自然语言接口的可靠性
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值