Decoupling Knowledge from Memorization: Retrieval-augmented Prompt Learning

最新推荐文章于 2024-10-01 17:55:56 发布

UnknownBody

最新推荐文章于 2024-10-01 17:55:56 发布

阅读量1.2k

点赞数

文章标签： prompt 语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/c_cpp_csharp/article/details/132495816

版权

LLM 日更专栏收录该内容

516 篇文章 3 订阅

已下架不支持订阅

本文提出RETROPROMPT，一种检索增强的提示学习方法，旨在解决传统提示学习中的遗忘和死记硬背问题。通过构建开卷知识库并实现检索机制，模型能在泛化和记忆之间取得平衡，提升小样本和零样本设置中的性能。实验表明RETROPROMPT在多个设置下优于其他方法，并减少了模型对内存的依赖。

摘要由CSDN通过智能技术生成

本文是LLM系列的文章，针对《Decoupling Knowledge from Memorization:
Retrieval

知识与记忆的解耦：检索增强的提示学习

摘要
1 引言
2 提示学习的前言
3 RETROPROMPT：检索增强的提示学习
4 实验
5 相关实验
6 结论与未来工作

摘要

提示学习方法在仍然遵循基于参数的学习范式的同时，通过诱导更好的小样本表现，在自然语言处理中掀起了波澜；学习中的遗忘和死记硬背问题可能会遇到不稳定的泛化问题。具体来说，在完全监督的训练中，朴素的提示学习可能很难死记硬背地利用非典型实例，或者用低样本数据过度拟合浅层模式。为了缓解这些限制，我们开发了RETROPROMPT，其动机是将知识与记忆脱钩，以帮助模型在泛化和记忆之间取得平衡。与普通的提示学习相比，RETROPROPT从训练实例中构建了一个开卷知识库，并在输入、训练和推理过程中实现了检索机制，从而使模型能够从训练语料库中检索相关上下文作为增强的线索。大量的实验表明，RETROPROPT可以在小样本和零样本设置中获得更好的性能。此外，我们还进一步说明了我们提出的RETROPROPT可以在新的数据集上产生更好的泛化能力。对记忆的详细分析确实表明，RETROPROMPT可以减少语言模型对记忆的依赖；因此，提高了下游任务的泛化能力。

1 引言

2 提示学习的前言

3 RETROPROMPT：检索增强的提

了解本专栏

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

已下架不支持订阅

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

UnknownBody 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。