机器阅读理解数据集

Cloze-style/ gap-filling(完型填空式)

任务定义:将文章中的某些单词隐去,让模型根据上下文判断被隐去的单词最可能是哪个。
数据集有:CNN/Daily Mail ,Children’s Book Test(CBT),BookTest,Who Did What,CLOTH, CliCR, LAMBADA,Quasar-S
在这里插入图片描述

Muti-Choice多项选择题

任务定义:给定一篇文章和一个问题,让模型从多个备选答案中选择一个最有可能是正确答案的选项。
此类形式和初高中时英语阅读理解题的类型相似,甚至有数据集以中国中学生英语考试的数据为基础构建数据集(RACE)。每篇文章对应多个问题,每个问题有多个候选答案,机器需要在这些候选答案中找到最合适的那个。通常这些候选答案与原文中的句子并不相同,即使相同也可能和问题毫不相关,所以仅靠判断相似性无法取得较好的效果。数据集:MCTest、RACE, DREAM, SWAG
在这里插入图片描

Span-Prediction/span-extraction片段抽取

任务定义:给定一篇文章和一个问题,让模型从文章中抽取连续的单词序列,并使得该序列尽可能的作为该问题的答案。即给定文章和问题,机器需要在文章中找到答案对应的区域(span),给出开始位置和结束位置,区域的长度通常不会限制。这类数据集中最常用的是斯坦福大学的SQuAD数据集。数据集有:SQuAD, SQuAD2, NewsQA, TriviaQA, QuAC, CoQA, SearchQA, Quasar-T, CMRC2018,DROP,HOTPOTQA
在这里插入图片描述
在这里插入图片描述

Free Answering自由问答

任务定义:与片段抽取任务不同的是,该序列不再限制于是文章中的句子。自由形式的问答是所有问答形式中最难的一个,它不限定问题所处的段落,即一个问题可能是需要理解多个段落甚至多篇文章,问题的答案是人为创造的,也就是既不会给定候选答案,也不是只需要提取文章中的片段。DuReader,Quasar-T,SearchQA,NarrativeQA ,MS MARCO
在这里插入图片描述

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值