论文笔记:Teaching Machine to Read and Comprehend

本文深入探讨了阅读理解领域的经典论文,重点介绍了Deep LSTM Reader、Attentive Reader和Impatient Reader三种神经网络模型。Deep LSTM Reader利用LSTM编码文档和问题;Attentive Reader引入注意力机制,强调关键信息;而Impatient Reader则进一步细化,每个问题词对应文档中的相关词。这些模型为后续的阅读理解研究奠定了基础。
摘要由CSDN通过智能技术生成

这篇论文可以说是阅读理解领域的奠基之作。

文中最主要的收获就是,提出的三种神经网络模型
1. Deep LSTM Reader
处理过程如图,这个图是用两层的lstm来encoder document ||| query对(这个符号|||表示链接),然后再用得到的表示做分类(得到的输出y,再输入到图右g函数,来做判断)。但是这个两层的lstm我暂时的理解是用了两个lstm。这里希望后续能找到源码看一下
这里写图片描述
这里写图片描述
圈出来的部分是我认为对这部分的介绍比较重要的部分,这里面我理解他说的是当我们将doc中的内容一个词一个词先输入到LSTM encoder中,然后在分割符(|||)后,把query也一个词一个词的输入到encoder中。这里作者也尝试了先将query输入encoder,然后再输入doc中的内容。结果却是模型把每个

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值