RAG论文 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

量化就是探索生活

已于 2024-04-25 13:46:37 修改

阅读量1.4k

点赞数 16

分类专栏： RAG 文章标签：自然语言处理人工智能

于 2024-04-01 00:12:35 首次发布

本文链接：https://blog.csdn.net/weixin_43420026/article/details/137077126

版权

RAG 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

RAG（Retrieval-Augmented Generation，检索增强生成）由Facebook在2020年发表的论文
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

语言模型存在幻觉

由于知识缺乏，没有实时增量信息
没有具体领域的拓展信息

RAG架构

RAG架构包含：参数记忆（预训练语言模型作为生成器）与非参数记忆（预训练文档检索器）两部分
非参数记忆部分包含两个子部分：
查询编码器（Query Encoder）：其将问题进行向量化
文档索引（Document Index）：通过另一个编码器将文档进行向量化，并构建文档向量索引

在这里插入图片描述

问题描述

对于一个查询序列 $x$ ,使用Maximum Inner Product Search (MIPS) 寻找最接近的 $K$ 个文本 $z_i$ 。为了得到最终结果 $y$ ，

检索器： $p_{\eta}(z|x)$ 返回文本 $z$ 与查询 $x$ 的相似性
生成器： $p_{\theta}(y_i|x,z.y_{1:i-1})$ ，根据文本 $z$ 与查询 $x$ 以及前 $i - 1$ 个token，生成下一个token

端到端的RAG模型旨在同时训练检索器和生成器

端到端模型

RAG-Sequence Model

$p_{\text {RAG-Sequence }}(y \mid x) \approx \sum_{z \in \operatorname{top}-k(p(\cdot \mid x))} p_\eta(z \mid x) p_\theta(y \mid x, z)=\sum_{z \in \operatorname{top}-k(p(\cdot \mid x))} p_\eta(z \mid x) \prod_i^N p_\theta\left(y_i \mid x, z, y_{1: i-1}\right)$
这个模型使用相同的检索文档来预测目标序列中的所有词元 (token)。它在整个生成过程中依赖单个文档，以保持一致性。

RAG-Token Model

$p_{\text {RAG-Token }}(y \mid x) \approx \prod_i^N \sum_{z \in \text { top }-k(p(\cdot \mid x))} p_\eta(z \mid x) p_\theta\left(y_i \mid x, z, y_{1: i-1}\right)$
在 RAG-Token 模型中，目标序列中的不同词元可以根据不同的文档进行预测。这提供了更大的灵活性，因为每个词元都可以从最相关的上下文中获益。

检索器

使用BERT——BASE模型向量化
$d(z)=BERT_d(z),q(x)=BERT_q(x)$
$p_\eta(z \mid x) \propto \exp \left(\mathbf{d}(z)^{\top} \mathbf{q}(x)\right)$

通过最大内积搜索计算相似度

生成器

使用encoder-decoder架构的BART_large，400M

训练

同时训练（微调）检索器和生成器，对于选用哪一篇文本没有任何监督。
样本为输入输出对
目标位最小化负对数似然函数
$minimize(\sum_j{-\text{log} \ {p(y_j|x_j)}})$
使用随机梯度下降和Adam优化器

为了减低训练负载，冻结文档检索器BERT_d，仅训练BERT_q 和 BART

解码过程

RAG-Token

由于模型是基于token逐次训练，得知每一步的概率。可以通过标准的beam search算法解码输出结果

Beam Search

对于贪心算法和全搜索算法的折中
贪心每一步选最大的一个
请添加图片描述
Beam Search每一步选最大的N个

算法描述
在这里插入图片描述

RAG-Sequence

不对每个token做beam search，对每个documents beam search。及评估每句话（sequence）被每个documents生成的概率。

量化就是探索生活

关注

16
点赞
踩
25

收藏

觉得还不错? 一键收藏
打赏
0
评论
RAG论文 Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks

RAG（Retrieval-Augmented Generation，检索增强生成）由Facebook在2020年发表的论文。
复制链接

扫一扫