【论文笔记】Decomposable attention

最新推荐文章于 2021-12-24 08:58:04 发布

Preke

最新推荐文章于 2021-12-24 08:58:04 发布

阅读量3.6k

点赞数 2

分类专栏：人工智能算法 NLP 阅读论文

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013398398/article/details/81024021

版权

人工智能算法同时被 3 个专栏收录

6 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

是这个Paper的一些笔记

Parikh A P, Täckström O, Das D, et al. A decomposable attention model for natural language inference[J]. arXiv preprint arXiv:1606.01933, 2016.

这是一个比较简单易行的方法：两个句子之间怎么做attention
下面这个博客有一些解析
https://zhuanlan.zhihu.com/p/26237357

我自己也再把representation的地方记录一下：

我们首先有两个句子

a = [a ¯ 1, . . ., a ¯ m]; b = [b ¯ 1, . . ., b ¯ n]

$a = [\bar{a}_1, ..., \bar{a}_m];\\ b = [\bar{b}_1, ..., \bar{b}_n]$

第一步: Attend

这里得到交互的权重矩阵。（这里的交互方式是用了把词向量过了前馈网络之后的结果做点积）。
接着

这两个公式是什么意思呢？
比如： $\alpha_j$ 就是对于句子 $a$ 中的每个词 $\bar{a}_i$ ，用它与句子 $b$ 中的词 $\bar{b}_j$ 的attention权重加权 $\bar{a}_i$ 的词向量得到的结果。反之亦然；

这里有点绕的就是：
$\alpha$ 对应的是句子 $b$ 中的词；
$\beta$ 对应的是句子 $a$ 中的词；
第二步 Compare

就是这两个公式

其中 $[\bar{a}_i, \beta_i]$ 就是把两部分concat起来
（句子中第 $i$ 个词, 和另一个句子里所有词与它比较的加权词向量）
$G$ 还是一个前馈神经网络
所以这一步的结果就是 $v_1, v_2$ 这两个向量
第三步 Aggregate

就是分别du把对 $v_1, v_2$ 中的每个元素求和，得到两个值之后做分类。

其实我认为representation的工作到第二步就可以截止了
得到向量之后，后面怎么做可以发挥一下。

（先不考虑self-align的话，其实到这里就结束了）

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Preke CSDN认证博客专家 CSDN认证企业博客

码龄11年

104: 原创

18万+: 周排名

112万+: 总排名

22万+: 访问

: 等级

3255: 积分

34: 粉丝

174: 获赞

29: 评论

102: 收藏

私信

关注

热门文章

分类专栏

最新评论

Word2vec 入门（skip-gram部分)
lzr936332553: 有必要Negative sampling吗？ Negative sampling 负采样的话是为了近似训练，改变任务目标。因为skip-gram一词分类多个词，词表中的单词都要进行多分类。则softmax不能胜任。负采样之后，任务可以转化成，center词和其他词判断是否为上下文词，则转化成了二分类问题，降低了任务复杂度。解决这个问题还可以使用层序softmax。
python 读取 json文件
风栖柳白杨: 真就啥也不是
我理解的X.509
weixin_45063667: 您好，老师让做一个X.509认证系统仿真，我不太懂，能给个联系方式么
A*算法————传教士和野人
middlto 回复 Ersonnnn: 博主的意思应该是，负载人数不能算上划船的，所以实际上船能装3个人，每次有两个人能到对岸不回来。
【机器学习笔记】Hessian矩阵
只布布倩: 博主写的很清晰，谢谢分享。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。