【一起读ACL论文】Attention-over-Attention Neural Networks for Reading Comprehension

最新推荐文章于 2021-11-03 14:40:21 发布

say_c_box

最新推荐文章于 2021-11-03 14:40:21 发布

阅读量599

点赞数

分类专栏： ————自然语言处理———— IE QA Text Mining Applications 文章标签：自然语言处理 acl 深度学习人工智能-神经网络

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/say_c_box/article/details/79770586

版权

————自然语言处理———— 同时被 2 个专栏收录

8 篇文章 0 订阅

订阅专栏

IE QA Text Mining Applications

2 篇文章 0 订阅

订阅专栏

一种针对完形填空式阅读理解的模型。综合来看，大概是双向考虑了文档->提问和提问->文档的关系。思想和实现都是非常简单的，从实验结果来看效果不错。而且也容易扩展到其他模型上。

这里写图片描述

整个模型如上图所示。大概分为三个部分：

和传统模型类似，先把Document和Query都embedding出来（用的是GRU）。

根据向量表示计算出一个矩阵表示，记为Pair-wise Matching Score. 表示查询的词语和文档词语之间的相关度。

$M(i,j) = h_{doc}(i)^T * h_{query}(j)$
计算出两个attention值出来，大概就是分别对矩阵的每一列和每一行做softmax。分别计算出query-to-document attention 和 document-to-query attention。

$\alpha(t)= softmax(M(1, t), .. , M(n, t))$

$\beta(t) = softmax(M(t ,1),..,M(t,m))$

在对每一行softmax之后，还需要对每一列得到的值取一个平均值。由此得到query-level attention。

$\beta = {1\over n} \sum^n_{t=1}\beta(t)$

用每个 query-to-document attention 和刚刚得到的 query-level attention 做点乘，得到 document 中每个词的 score。

$s = \alpha^T* \beta$
最后合并相同的词语。并计算出每个词语的score

$P(w|D,Q) = \sum s_i$

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
【一起读ACL论文】Attention-over-Attention Neural Networks for Reading Comprehension

一种针对完形填空式阅读理解的模型。综合来看，大概是双向考虑了文档-&gt;提问和提问-&gt;文档的关系。思想和实现都是非常简单的，从实验结果来看效果不错。而且也容易扩展到其他模型上。整个模型如上图所示。大概分为三个部分：和传统模型类似，先把Document和Query都embedding出来（用的是GRU）。根据向量表示计算出一个矩阵表示，记为Pair-wise Matchin...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。