Attention Sum Reader Network
数据集
CNN&DailyMail
每篇文章作为一个文档(document),在文档的summary中剔除一个实体类单词,并作为问题(question),剔除的实体类单词即作为答案(answer),该文档中所有的实体类单词均可为候选答案(candidate answers)。其中每个样本将文本中所有的命名实体用类似“@entity1”替代,并随机打乱表示。
儿童故事(Children’s Book Test,CBT)
从每一个儿童故事中提取20个连续的句子作为文档(document),第21个句子作为问题(question),并从中剔除一个实体类单词作为答案(answer)。
模型简介
与Attentive Reader十分类似,是一种一维匹配模型(Stanford Attentive Reader也是),主要是在最后的 Answer 判断应用了一种 Pointer Sum Attention 机制,模型结构如下图所示:
<