【论文笔记】Improving Machine Reading Comprehension with General Reading Strategies（2019，NAACL）

最新推荐文章于 2022-04-25 16:39:34 发布

mottled233

最新推荐文章于 2022-04-25 16:39:34 发布

阅读量1k

点赞数 2

分类专栏： NLP 文章标签：深度学习机器学习 NLP 人工智能机器阅读理解

本文链接：https://blog.csdn.net/mottled233/article/details/104535173

版权

论文提出三种阅读策略优化机器阅读理解：前后阅读(BF)、高亮(HL)和自我评估(SA)，分别模拟人类阅读过程中的不同行为。BF通过调整输入顺序，HL通过附加信息模拟高亮，SA通过生成问题进行数据增强。实验表明这些策略能有效提升非抽取式阅读理解任务的性能。

摘要由CSDN通过智能技术生成

这篇论文在GPT模型的基础上，根据人类认知科学，提出了对非抽取式阅读理解任务的三个优化策略，分别被作者称为前后阅读(BACK AND FORTH READING，BF)，高亮阅读（HIGHLIGHT, HL)，自我评价（SELF-ASSESSMENT，SA），实际上分别对应输入策略，附加信息，数据增强的策略，对如何进行阅读理解的优化有启发作用。

1.介绍

作者认为，相对于抽取式阅读理解问题，非抽取式的任务由于其不限定于用原文回答，大部分问题不在原文出现，因此需要多样的阅读技巧才能回答，比抽取式的简单匹配更能体现阅读能力。
在这里插入图片描述
上图展示了几个非抽取式数据集的统计信息和非抽取问题的比例。

作者认为，预训练模型的提升要求的代价很大，从计算力方面和语料方面皆是如此。作者认为在fine-tuning阶段的训练策略也可以很大提升性能。

实际上，就是压榨模型的能力。当然，作者提出的策略也很有启发意义。

作者研究了人类认知学的几篇论文

Measuring esl students’ awareness of reading strategies
Assessing students’ metacognitive awareness of reading strategies.
iSTART: Interactive strategy training for active reading and thinking

提出了三个在实验中证明有效提升效果的策略：

前后阅读(BACK AND FORTH READING，BF)：为了找到答案，常常反复按不同顺序进行阅读，在模型中，作者用颠倒问题、答案、文章的输入顺序来模拟这一点。
高亮阅读（HIGHLIGHT, HL)：阅读时，高亮有用的信息常常有利于记忆，在模型中作者通过将文章的词嵌入附加问题、答案相关信息来模拟这一点。
自我评价（SELF-ASSESSMENT，SA）阅读时，人类通常会通过对自己提问题来确定自己对文章的理解。作者通过从文章中生成一些问题进行反复训练来模拟这点。