Unsupervised Question Answering by Cloze Translation(基于完形填空转换的无监督问答)
Facebook research,开源,数据集为SQuAD
1.介绍
当前问题:抽取式问答需要大量训练数据,但对于一个新领域或者新的语种,收集训练集是需要大量人类和物力的。
目标:不需要使用监督QA,就能够在给定文档后生成准确的问题,利用生成的问题训练一个QA系统。
解决方法:
- 先用无监督方法生成文本内容(context)、问题(question)、答案(answer)三元组。
- 基于上述三元组自动合成抽取式问答的训练集。
三元组生成具体步骤:
- 从维基百科爬取文档,随机选取段落(context paragraphs)
- 从段落中随机地选出名词短语(nou phrases,NP)或命名实体(,NE)作为答案
- 将段落中的答案转为完形填空形式的cloze questions
- 再将cloze questions转为自然语言问题
2.无监督EQA
抽取式问答中问题为q,相关的段落文本内容c,问题对应的答案a = ( b , e )
本文的方案由2阶段组成:
(1设计一个生成模型p ( q , a , c ) ,不使用监督QA。
(2)使用p作为生成器训练一个判别模型pr(a∣q,c),生成器p(q,a,c)=p©p(a∣c)p(q∣a,c)会以一个逆向的形式产生数据:先通过p ( c ) 采样一段文本,再通过 p(a∣c)计算文本范围内的答案,最后通过p(q∣a,c)得到该答案和文本所对应的问题。
2.1文本和答案生成
通过p(a∣c)生成答案。
p(a∣c)可选择:名词短语(Noun Phrases、命名实体(Named Entities)
2.2问题生成
- 完形填空生成:q′=cloze(a,c)
(1)可选用答案周围的句子
(2)可通过限制答案周围的从句(subclauses)以进一步降低长度
-
问题转换:p(q∣q′)
(1)Identity Mapping(恒等映射);(2)Noisy Clozes(噪声化的完形填空):
将完形填空与自然问题间的差别当做一种干扰形式。
(3)Rule-Based(基于规则):句首加wh*,句尾加?,并进行适当地词序调换
**(4)Seq2Seq:**无监督神经机器翻译(UNMT),分别建立完形填空语料库和自然问题语料库,两者不是平行语料,见2.4。
2.3 问答
通过生成模型得到抽取式问答的答案有两种思路:
(1)训练一个独立的QA系统:训练集来自于本文生成器的生成。
(2)使用后验概率:什么样的问题最可能生成这样的答案
2.4无监督完形填空转换
完型语料库
自然问题语料库
**wh’‘的启发式规则:**将每个答案类型映射到最合适的wh’'单词。
在目标问题前面加上答案类型标记,将其映射到训练时的wh*单词。
3 实验结果
3.2消融研究和分析
1.问答(2.3):训练后的QA模型优于最大后验概率
2.答案的先验知识(2.1):命名实体(NEs)比名词短语(NPs)更有效,因为NE 少,降低了候选答案的 搜索空间
3.句子长度:降低完形填空问题的长度有助于translation操作生成更简单且更精确的问题。
4.QA模型选取(2.3.1):BERT-base比BiDAF+SA更优秀
5.基于规则生成数据的影响(2.2.3):看不懂
3.3错误分析
QA模型虽然使用的训练集中只有NE类型的答案,但是预测答案时并不总是选用命名实体作为答案。
原因:预训练的BERT已经捕获一定的语言学特征,所以能够归纳出NEs在句子中所起的语义作用,而不是简单地模仿NER系统。
对于不同的wh*,系统的处理能力不同,其中when最好,what最差
3.5小样本问答
在拥有少量带标签数据的情况下,表现优于其他方案。
5.总结及比较
优点:无监督、无需三元组数据
缺点:需借助NER系统和用于提取从句的解析器,用到特定语言(英语)的wh*启发式规则
具有高局限性