REPT: Bridging Language Models and Machine Reading Comprehension via Retrieval-Based Pre-training 阅读

最新推荐文章于 2024-09-20 23:31:36 发布

fengshanghere

最新推荐文章于 2024-09-20 23:31:36 发布

阅读量330

点赞数

分类专栏：论文阅读文章标签：自然语言处理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fengshanghere/article/details/117716424

版权

论文阅读专栏收录该内容

5 篇文章 0 订阅

订阅专栏

发顺丰

目录

Fine tune阶段

Multiple Choice QA

motivation

PLM更注重通用的语义表示，MRC需要从多个文档或句子中抽取证据。

通过Surrounding Sentences Prediction（SSP）和 Retrieval based Masked Language Modeling （RMLM）来弥补PLM和MRC之间的gap，增强PLM的证据抽取能力，在MRC任务上可以很好的迁移这些能力。

方法

预处理

数据集：英文维基百科，2020/5/1。用bert tokenized切成500个token一个segment。每个segment看成一个doc，切成句。句子token数小于5的拼到前面去。

每个doc，选30%最重要的句子作为query。实体或名词出现的次数越多越重要，一个句子中包含的实体和名词重要度的累加为句子重要度。将其中的被提到的实体或和名词mask，防止模型学到shortcut

任务定义

前t个为从doc中抽取的query。

SSP任务

从doc中抽取几个句子作为query，剩下的合并作为passage，模型预测每个query的前一句和后一句。为了避免学到shortcut，将query中重复出现的实体或名词按比例mask掉。

BERT maask 90%实体 30%名词,

ROBERTa mask 90%实体 30%名词, 和90%实体 90%名词两份数据集，训练的时候混合一起训练。

预测query原先的位置，函数r是输出query原先的顺序。

SSP任务是要预测query的在原来的文档中前一句和后一句

RMLM任务

还原mask掉的实体或名词

模型

Query表示

在预训练阶段，复用了上述公式，

来生成任务特定的query表示，来缓解overfit

SSP

query在hidden上做singe-head attention，获取证据信息，dense获得每个句子对query的得分。

RELM

z表示query中被mask的token的index。

函数f是 normalized的两层dense，

优化函数

a，b表示query对应的原始doc中的前一句和后一句index，其概率分布如下。

SSP的目标函数

RMLM中，query被mask的token 的index集合为，golden集合为

恢复mask的token概率为

x‘ 表示词表中的token ，e(x)为x的word embeding。

目标函数为

Fine tune阶段

对于multiple choice QA，把问题和选项拼起来最为query。每个example可以i变成

query的表示仍然使用Query表示部分的多头注意力。证据抽取过程不同的任务不同。

Multiple Choice QA

每个句子的表示为

对于Multi-RC数据集，不定项选择题，每个选项二分类

Span Extraction

实验结果

BERT w.M 继续用MLM任务，维基百科数据训BERT

BERT-Q 加入多头注意力机制获取query表示

BERT-Q w. R/S 在BERT-Q的基础上，用SSP和RMLM任务pretrain

BERT-Q w. R 用RMLM任务pretrain

相比于base，性能提升比较明显。但是加入了两个预训练任务进行post train。

1. 只用多头注意力机制获取query表示性能提升不明显甚至下降，必须配合预训练任务，

2. 用MLMpost train，性能提升有限

3. 两个任务一起使用性能好，只用一个效果不明显，只用RMLM性能下降

在Span Extraction 任务上 Multi-RC

GRR 是Graph Recurrent Retriever

在SQuAD 2.0

在Multi-RC上证据抽取的准召率。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。