DuoRC: Towards Complex Language Understanding with Paraphrased Reading Comprehension
DuoRC分析
数量:186089对Q-A对
Source:来自7680个电影情节,每对来自两个版本,一个版本来自WiKi,另外一个来自IMD。
特征:问题和答案是从描述相同故事的文档的不同版本创建的,通过设计确保,从一个版本创建的问题与包含另一个版本答案的段之间在词汇上几乎没有重叠。
另外,这两个版本在叙事风格和词汇上均不同。
第二个版本的问题需要更深的理解和相关的背景知识。
需要多...
原创
2019-06-23 16:10:33 ·
372 阅读 ·
0 评论