DPR：一种开放式问答（QA）模型

最新推荐文章于 2025-02-16 00:33:10 发布

AI强仔

最新推荐文章于 2025-02-16 00:33:10 发布

阅读量3.9k

点赞数 4

分类专栏： transformer 人工智能

人工智能同时被 2 个专栏收录

151 篇文章

订阅专栏

transformer

33 篇文章

订阅专栏

1 简介

DPR：Dense Passage Retrieval，密集文本段检索。
本文根据《Dense Passage Retrieval for Open-Domain Question Answering》翻译总结。

开放式问答依赖于有效的文本检索来选择候选内容。传统的方法TF-IDF、BM25采用的是稀疏向量空间方法。而我们发现可以使用密集表达，其中embedding可以在双重encoder框架下学习小数量的问题与文章来获得，我们采用的BERT来学习文本embedding。

密集的（隐藏层语义编码）是稀疏表达的补充。如回答问题“Who is the bad guy in lord of the rings?”（谁是指环王中坏蛋？），我们可以通过文本“Sala Baker is best known for portraying the villain Sauron in the Lord of the Rings trilogy.”（ Sala Baker在指环王中扮演反面角色Sauron）找到答案。但是term-based的方法很难找到正确答案，不过密集（dense）方法可以匹配出“bad”和“villain”（反面角色）。

学习密集向量表达（dense vector representation）需要大量的标签数据对：问题和相关文本。

QRAR方法已经展示了密集检索可以超越BM25。