机器阅读理解数据集

最新推荐文章于 2022-12-08 17:00:30 发布

刘大敏

最新推荐文章于 2022-12-08 17:00:30 发布

阅读量481

点赞数

文章标签：自然语言处理 nlp

本文链接：https://blog.csdn.net/LXM9984/article/details/109827680

版权

Cloze-style/ gap-filling（完型填空式）

任务定义：将文章中的某些单词隐去，让模型根据上下文判断被隐去的单词最可能是哪个。
数据集有：CNN/Daily Mail ，Children’s Book Test（CBT），BookTest，Who Did What,CLOTH, CliCR, LAMBADA，Quasar-S
在这里插入图片描述

Muti-Choice多项选择题

任务定义：给定一篇文章和一个问题，让模型从多个备选答案中选择一个最有可能是正确答案的选项。
此类形式和初高中时英语阅读理解题的类型相似，甚至有数据集以中国中学生英语考试的数据为基础构建数据集（RACE）。每篇文章对应多个问题，每个问题有多个候选答案，机器需要在这些候选答案中找到最合适的那个。通常这些候选答案与原文中的句子并不相同，即使相同也可能和问题毫不相关，所以仅靠判断相似性无法取得较好的效果。数据集：MCTest、RACE, DREAM, SWAG
在这里插入图片描

Span-Prediction/span-extraction片段抽取

任务定义：给定一篇文章和一个问题，让模型从文章中抽取连续的单词序列，并使得该序列尽可能的作为该问题的答案。即给定文章和问题，机器需要在文章中找到答案对应的区域（span），给出开始位置和结束位置，区域的长度通常不会限制。这类数据集中最常用的是斯坦福大学的SQuAD数据集。数据集有：SQuAD, SQuAD2, NewsQA, TriviaQA, QuAC, CoQA, SearchQA, Quasar-T, CMRC2018,DROP，HOTPOTQA
在这里插入图片描述

Free Answering自由问答

任务定义：与片段抽取任务不同的是，该序列不再限制于是文章中的句子。自由形式的问答是所有问答形式中最难的一个，它不限定问题所处的段落，即一个问题可能是需要理解多个段落甚至多篇文章，问题的答案是人为创造的，也就是既不会给定候选答案，也不是只需要提取文章中的片段。DuReader，Quasar-T，SearchQA，NarrativeQA ，MS MARCO
在这里插入图片描述