1.文章采用Document Retriever + Document Reader, 其中Document Retriever的问题是从Wikipedia抽取出相关的文档或段落,然后利用Document Reader进行阅读理解。
2.Document Retriever采用的是TFIDF,Document Reader采用的是Bi-LSTM
3.Document Retriever会检索到不包含答案的段落,从而加入了加入了Paragraph ranking,对检索到的Paragraph,根据问题embedding和段落embedding的相似性进行排序,只读前M个段落。
4.采用Paragraph Selector对检索到的段落进行过滤。
5.RETRIEVER和READER的多步交互,根据Reader的状态对query进行更新,更新的query用来重新检索段落,迭代多步后输出最后一步检索阅读后产生的答案。
6.设计了RETRIEVER和READER的多步交互,根据Reader的状态对query进行更新,更新的query用来重新检索段落,迭代多步后输出最后一步检索阅读后产生的答案。
7.没有考虑到段落之间的联系。由于正确答案往往有多个证据(evidence),而错误答案只有个别证据。所以进行了融合。
8.在模型上也有不同的改进。由于之前的模型[1,2],问题和段落交互很少,都是将问题编码成问题向量,段落编码成段落向量然后进行(单层)交互。[5]提出对问题和段落编码的各个层进行全连接交互。