这篇论文可以说是阅读理解领域的奠基之作。
文中最主要的收获就是,提出的三种神经网络模型
1. Deep LSTM Reader
处理过程如图,这个图是用两层的lstm来encoder document ||| query对(这个符号|||表示链接),然后再用得到的表示做分类(得到的输出y,再输入到图右g函数,来做判断)。但是这个两层的lstm我暂时的理解是用了两个lstm。这里希望后续能找到源码看一下
圈出来的部分是我认为对这部分的介绍比较重要的部分,这里面我理解他说的是当我们将doc中的内容一个词一个词先输入到LSTM encoder中,然后在分割符(|||)后,把query也一个词一个词的输入到encoder中。这里作者也尝试了先将query输入encoder,然后再输入doc中的内容。结果却是模型把每个