哈工大：LLM通过自主学习积累任务经验

大模型任我行

于 2024-08-22 21:00:00 发布

阅读量230

点赞数 2

分类专栏：大模型-推理优化文章标签：人工智能自然语言处理语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46739757/article/details/141428438

版权

大模型-推理优化专栏收录该内容

1 篇文章 0 订阅

订阅专栏

在这里插入图片描述

📖标题：Self-Evolving GPT: A Lifelong Autonomous Experiential Learner
🌐来源：arXiv, 2407.08937

🛎️文章简介

🔸研究问题：大语言模型（LLM）由于缺乏经验无法有效处理某些任务，能否通过自主学习实现经验积累。
🔸主要贡献：论文提出了一种名为SE-GPT的终身自主经验学习框架，通过不断积累解决任务的经验，能根据输入问题自动选择合适的经验进行响应。

📝重点思路

🔺相关工作

🔸为了提高LLM的表现，早期由研究人员通过提示提供文本体验，最近的工作重点是让LLM自动获得任务解决经验。
🔸情境学习（ICL）为LLM提供演示，可以被视为文本经验的特定替代品，但存在格式不正确、噪音和多样性低等问题。

🔺论文方案

🔸框架：由一个特定于任务的经验记忆和五个基于ChatGPT的以经验为中心的模块组成。
🔸任务响应：收集到用户问题后，自动对识别问题的任务类型，并使用经验库进行响应。
🔸经验更新：对于尚未掌握的任务，通过经验迁移（检索相关任务）、自主练习（检索验证）和经验归纳（总结正确和错误响应），更新经验库后再进行响应。

🔎分析总结

🔸SE-GPT在性能上持续优于基线方法，并分别提高了零样本GPT-3.5和GPT-4的平均性能。
🔸任务分类是框架的第一个模块，严重影响后续模块的性能。
🔸经验迁移和归纳模块对框架的整体性能和经验量有显著贡献，因为它们能够从其他任务转移经验或从多个示例中总结经验。

💡个人观点

论文的创新点是提出了一种能够自动学习和积累经验的自适应经验学习框架。

附录

在这里插入图片描述

大模型任我行

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
哈工大：LLM通过自主学习积累任务经验

大语言模型（LLM）由于缺乏经验无法有效处理某些任务，能否通过自主学习实现经验积累？论文提出了一种名为SE-GPT的终身自主经验学习框架，通过不断积累解决任务的经验，能根据输入问题自动选择合适的经验进行响应。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。