Re59：读论文 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

最新推荐文章于 2024-04-17 20:07:04 发布

诸神缄默不语

最新推荐文章于 2024-04-17 20:07:04 发布

阅读量932

点赞数 1

分类专栏：人工智能学习笔记文章标签：自然语言处理人工智能 RAG LLM NLP 大规模预训练语言模型 QA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/PolarisRisingWar/article/details/134975072

版权

人工智能学习笔记专栏收录该内容

243 篇文章 260 订阅

订阅专栏

诸神缄默不语-个人CSDN博文目录
 诸神缄默不语的论文阅读笔记和分类

论文名称：Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
模型开源地址：https://huggingface.co/facebook/rag-token-nq

ArXiv下载地址：https://arxiv.org/abs/2005.11401

本文是2020年NeurIPS论文，属于RAG+LLM领域。作者来自Facebook

本文的研究背景也是说直接用LM存储的知识不够，且难以扩展和修正，有幻觉，还是得上检索（提供决策出处，可以更新知识）。
LM是预训练的seq2seq模型（BART），知识库是维基百科的稠密向量索引（用预训练的神经网络实现检索 Dense Passage Retriever (DPR)）。要么一次检索一波（per-output basis），要么一个token检索一波（per-token basis）（这个见模型部分）。

其实看起来就是REALM的拓展版，将检索文档改成视为隐变量，然后拓展了下游任务，而且是全链路端到端的训练。
比REALM迟，参考文献里就有REALM。但是不用代价高昂的“salient span masking” pre-training

总之整个工作还是做得很全面的，实验充分，真羡慕啊。

在这里插入图片描述

文章目录

1. related work
2. 模型
3. 实验

1. related work

non-parametric memory除检索外的形式：
memory networks
stack-augmented networks
memory layers

RAG知识量大而且不需要额外训练

knowledge-intensive tasks：人们认为没有额外知识就没法做的任务，比如常识题（什么行测）

2. 模型

端到端训练：将检索到的文档视为隐变量

RAG-Sequence：对每一篇检索文档都预测完整的生成结果，加总
在这里插入图片描述

RAG-Token：每一个token都是大家的机会，每个token上重新检索一次
在这里插入图片描述

检索器DPR
在这里插入图片描述
top k：Maximum Inner Product Search (MIPS)问题 ← FAISS

生成器BART
（在实验中只更新query encoder和生成器）

训练时没有检索文档的标注信息。

解码：

RAG-Token：标准生成任务
RAG-Sequence：Thorough Decoding + Fast Decoding（没看懂其实，以后再看）

3. 实验

Jeopardy Question Generation指标这里用了一个Q-BLEU，以前我还真没见过

在这里插入图片描述

还有一条是生成能获得原文中没有的结果

在这里插入图片描述
在生成方面还有一些别的优势，略。

在这里插入图片描述

在这里插入图片描述

RAG-Token的后验概率可视化：
在这里插入图片描述
这里面这个太阳照常升起和永别了武器都是在开头概率高了点，后面就平了，论文里提及认为这里时因为模型内置信息能够自己填完了，还做了个小实验。

生成的多样性：
在这里插入图片描述

冻结检索器的消融实验：
在这里插入图片描述

更新知识的实验

检索文档数（K）的影响：
在这里插入图片描述

诸神缄默不语

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Re59：读论文 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

论文阅读笔记：Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

诸神缄默不语 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。