QA（三）：复杂attention机制(coattention及bi-attention)

最新推荐文章于 2024-03-25 16:32:19 发布

wendaJ

最新推荐文章于 2024-03-25 16:32:19 发布

阅读量1.9w

点赞数 7

分类专栏：自然语言处理文章标签： qa 自然语言处理 attention

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/chazhongxinbitc/article/details/78825704

版权

DCN-动态共同attention网络

两种模型都是类似的，不像前一篇文章介绍的soft attention机制，只是考虑query到context的attention

这里两篇论文都会考虑
query 到 context 和 context到query的attention
然后得到的attention回和原始的encoder向量进行作用，得到修正后的query和context的修正矩阵

然后这些修正后的矩阵和原始的encoder矩阵结合，进入到下面一层的模型预测层。

首先介绍的是coattebtion机制
DYNAMIC COATTENTION NETWORKS
https://arxiv.org/pdf/1611.01604.pdf
标签：相关性矩阵，互为attention，coattention
迭代，HMN，MLP
短文本效果佳

模型

这里写图片描述
上图是一个简单的图形，question 和文本经过encoder之后，得到的向量经过 coattention机制在进行encoder，然后decoder得到结果

Passage AND QUESTION ENCODER

对文本passage 和question分别独立进行encoder
$H^p=LSTM(P)$
$H^q=LSTM(Q)$

$H^p \in R^{[l, p]}, H^q \in R^{[l, q]}$
l 是LSTMcell的隐藏层大小，p和q分别是文本passage 和问题question的长度

然后每个向量后面加上一个特殊的向量，作为模型的识别，得到

$H^p=[H^p,h^p_{\theta }]$
$H^{q}=[H^q,h^q_{\theta }]$

然后qustion经过一层非线性的网络，得到最终的encoder矩阵：

$H^q=tanh(W^q H^q + b^q)$

coattention encoder

首先计算一个相关性矩阵：

$L=(H^p)^TH^q \in R^{(p+1)*(q+1)}$

然后利用相关性矩阵，可以计算passage里面的每一个词和question的attention分数 $A^Q$
以及question里面每一个词和passage里面每一个词的attention分数 $A^P$

$A^Q=softmax(L)$
$A^P=softmax(L^T)$

这两个都是相互的attention score，权重score需要和原始的矩阵机型相乘计算。
我们对文本passage 进行summary，然后经过attention后得到question的修正向量矩阵：

$C^Q=H^pA^Q \in R^{l * (n+1)}$

然后我们利用question矩阵 $H^q$ 和修正后的question矩阵 $C^Q$ , 经过attention之后，得到修正后的passage 矩阵：

最低0.47元/天解锁文章

关注

7
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
QA（三）：复杂attention机制(coattention及bi-attention)

DCN-动态共同attention网络两种模型都是类似的，不像前一篇文章介绍的soft attention机制，只是考虑query到context的attention这里两篇论文都会考虑 query 到 context 和 context到query的attention 然后得到的attention回和原始的encoder向量进行作用，得到修正后的query和context的修正矩阵然后这些修
复制链接

扫一扫

专栏目录

wendaJ CSDN认证博客专家 CSDN认证企业博客

码龄15年

24: 原创

10万+: 周排名

9万+: 总排名

6万+: 访问

: 等级

802: 积分

74: 粉丝

59: 获赞

13: 评论

109: 收藏

私信

关注

热门文章

分类专栏

最新评论

学习卡片-随机梯度下降
CSDN-Ada助手: 同是寒窗苦读，怎愿甘拜下风！
AI应该为产业化带来些变化
幻灰龙: 但是作为一个工程师，很难同时从事这些事情，也很难自己做这些事情，他还是需要考虑：“什么企业有什么数据，这些数据可以通过AI技术增强或者提供创新的能力”。
AI应该为产业化带来些变化
wendaJ: 像国外的reddit，或者在twitter上面，这个话题的讨论都是非常专业活跃的
AI应该为产业化带来些变化
wendaJ: 基因测序、AI干预种群保护、AI加速碳减排等，AI加速新药研发，觉得除了常规我们知道的一些AI商业化应用，这些方向可能是我觉的值得去投入的
AI应该为产业化带来些变化
幻灰龙: 赞，“CSDN如何留住相对高阶的技术创作人员” 你觉的算法能做些什么？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。