【LLM 论文】背诵增强 LLM：Recitation-Augmented LM

yubinCloud

于 2024-05-05 13:43:40 发布

阅读量653

点赞数 4

分类专栏： LLM Research 文章标签：人工智能深度学习机器学习语言模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45668004/article/details/138465170

版权

LLM Research 专栏收录该内容

43 篇文章

订阅专栏

论文：Recitation-Augmented Language Models
⭐⭐⭐
ICLR 2023, Google Research, arXiv:2210.01296
Code：github.com/Edward-Sun/RECITE

文章目录

- 论文速读

论文速读

论文的整体思路还是挺简单的，就是让 LLM 面对一个 question，首先先背诵（recitation）一遍自己知道的相关段落，然后再回答答案，如下图所示（最右边的是 Recitation-augmented Generation）：

实现的方式就是通过 in-context learning，为 LLM 提供几个带有 recitation 的 few-shot exemplars。

这种 two-step 的范式，将原来的知识密集型任务分解为了两个子任务：knowledge-recitation 和 task-execution，前者可以视为一种中间的知识获取步骤（从 LLM 的内部参数中）。

论文还举了一个例子来说明为什么这种方法可行。比如问题是“ $\pi$ 的第十位小数是什么”，也许 LLM 的训练资料中没有关于这个问题的直接回答，但是它可能可以背出“ $\pi$ 的前面的数字是 3.1415926535”，这样他就可以回答出答案是 5。

另外，论文还尝试与 self-consistency 和 multi-hop 多轮背诵的方法进行结合来解决更加复杂的问题，如下图：

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。