【RAG 论文】FiD：一种将 retrieved docs 合并输入给 LM 的方法

最新推荐文章于 2024-08-14 15:34:00 发布

yubinCloud

最新推荐文章于 2024-08-14 15:34:00 发布

阅读量654

点赞数 10

分类专栏： LLM Research 文章标签：人工智能语言模型自然语言处理

本文链接：https://blog.csdn.net/qq_45668004/article/details/138768308

版权

LLM Research 专栏收录该内容

43 篇文章 19 订阅

订阅专栏

论文： Leveraging Passage Retrieval with Generative Models for Open Domain Question Answering

⭐⭐⭐⭐

EACL 2021, Facebook AI Research

论文速读

在 RAG 中，如何将检索出的 passages 做聚合并输入到生成模型是一个问题，本文提出了一个简单有效的方案：FiD。

下图是一个简单的 open-domain QA 的使用方式，它直接将 question 和检索到的所有 passages 拼接起来，以 <question, retrieved passages> 的形式扔给 seq2seq 模型来生成 answer：

这种处理方式中，随着 retrieved passages 的数量增多，由于 Self-Attention 的运算机制，计算复杂度会呈现二次增长。

本论文提出了一个简单直接的方法 —— FiD（Fusion-in-Decoder）—— 将检索回来的每一个 passage 都独立与 question 用一些特殊符号作为间隔拼接起来并输给 encoder 做编码，然后 concat 在一起输入给 decoder 生成 final answer，所以称之为 Fusion-in-Decoder：