论文笔记《Gated-Attention Readers for Text Comprehension》

来源1606.01549

这篇论文提出的模型叫做GA Reader,用的是GRU,GRU中的两个门及候选状态的推理公式如下:这里写图片描述


GA Reader的实现思路为:
1,对于query首先也是用双向GRU处理,然后分别获取最后的状态concate一起。
2,对于doc也是用双向GRU处理,但是是输出每个时刻的Hidden,最后concate在一起。
3,然后用一个K层网络来处理,网络第一层是1,2步处理的query_emb和doc_emb对位相乘,也就是element-wise运算,假设得到的是temp_doc,然后这个temp_doc会输出到第二层,第二层完成的运算仍然是temp_doc和query_emb的对位相乘。如此循环下去。也就是说,K层会接收从K-1层来的temp_doc,然后仍然和query_doc进行element-wise运算。
4,其实与doc进行element-wise的并不是最初输出的query_doc,而是经过了一些处理的,如下面截图中3.1.2中红圈圈出来的部分,先用query_emb和d

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值