ExpeL: LLM Agents Are Experiential Learners

515 篇文章 3 订阅

已下架不支持订阅

67 篇文章 0 订阅
本文介绍了一种名为ExpeL的体验式学习代理,它利用大型语言模型(LLM)从任务中自主学习而无需参数更新。ExpeL代理通过自然语言收集经验,并在推理时利用这些经验做出决策,展现出强大的学习效能和迁移学习潜力。尽管存在局限性,如只处理文本观测和依赖封闭源API,但ExpeL为LLM在决策任务中的应用提供了新的视角。
摘要由CSDN通过智能技术生成

本文是LLM系列文章,针对《ExpeL: LLM Agents Are Experiential Learners》的翻译。

摘要

最近,通过利用大型语言模型中嵌入的广泛世界知识,将大型语言模型应用于决策任务的研究兴趣激增。虽然为自定义决策任务定制LLM的需求越来越大,但为特定任务微调LLM是资源密集型的,可能会削弱模型的泛化能力。此外,最先进的语言模型,如GPT-4和Claude,主要可以通过API调用访问,其参数权重仍然是专有的,对公众不可用。这种情况强调了对新方法的日益增长的需求,这种方法允许在不需要参数更新的情况下从代理体验中学习。为了解决这些问题,我们引入了体验式学习(ExpeL)代理。我们的代理使用自然语言从一系列训练任务中自主收集经验和提取知识。在推理时,代理人会回忆起自己提取的见解和过去的经历,以做出明智的决定。我们的实证结果突出了ExpeL代理强大的学习效能,表明随着经验的积累,其性能不断增强。我们通过定性观察和额外的实验进一步探索了ExpeL代理的新兴能力和迁移学习潜力。

1 引言

2 相关工作

3 前言

4 ExpeL:一个实验学习代理

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

已下架不支持订阅

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

UnknownBody

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值