Latent Retrieval for Weakly Supervised Open Domain Question Answering

chansonzhang

于 2022-01-03 18:55:53 发布

阅读量660

点赞数 1

分类专栏： NLP Papers NLP AI 文章标签：机器学习人工智能算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chansonzhang/article/details/122286754

版权

NLP Papers 同时被 3 个专栏收录

54 篇文章 23 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

68 篇文章 2 订阅

订阅专栏

60 篇文章 1 订阅

订阅专栏

Abstract

开放领域问答系统近期的工作都假设了 support evidence 的强监督，或者假设有一个黑盒 IR 系统来检索 evidence candidates.

我们认为这二者都不是最优解，因为 gold evidence 并非总是存在，而且 QA 与 IR 存在本质上的不同。

我们是第一个证明 retriever 和 reader 也许可以从问答对中联合学习，并且不需要任何的 IR 系统。在这种设置下，从维基百科中进行 evidence retrieval 可以看成一种 latent variable.

由于从头学习是不实际的，我们使用 Inverse Cloze Task （ICT）任务来预训练 retriever.

我们在 5 种数据集上进行测试，并发现:

在提问者已经知道答案的数据集上，传统的 IR 系统，例如 BM25 就足够了
在用户真的在寻求答案的数据集上，学到的 retriever 非常关键，在 exact match 性能上超过 BM25 达 19 个点之多。

Introduction

现有的方法需要一个 IR 系统来做很多繁重的工作，即便这个 IR 系统无法在下游任务上 fine-tune. 这些方法都依赖 IR 系统来缩小搜索空间或减少歧义。然而，QA 和 IR 具有本质上的区别，IR 主要关注 lexical and semantic 匹配，而 QA 中的问题是非常不明确的因而需要更多的语言理解，因为用户是在显式地寻找未知的信息。与其受限于 IR 的召回天花板，我们不如直

了解本专栏

超级会员免费看

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Latent Retrieval for Weakly Supervised Open Domain Question Answering

第一个 retriever 和 reader 端到端联合学习的开放领域问答系统
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。