深度学习（十五）self-attention

最新推荐文章于 2024-07-15 14:42:37 发布

ZEKEGU1997

最新推荐文章于 2024-07-15 14:42:37 发布

阅读量482

点赞数 1

分类专栏：深度学习文章标签：机器学习深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_43533956/article/details/117257417

版权

李宏毅老师课程链接
对于seq2seq的问题，可以选择用RNN或者CNN来解决，但是RNN无法做到平行的处理一个序列，也很难处理一个很长的序列。而CNN则需要多层才能看到比较多的信息。
在这里插入图片描述
而self-attention可以解决这些问题。

构建self-attention，首先将输入x转化成a，再把a分别转化成q,k,v，分别是匹配项，被匹配项和提炼信息。
在这里插入图片描述
将1个q和每个k一次做attention计算（点乘除以维数的根）得到a1i

然后把所有a1i做一次softmax。

把每个结果乘上vi，再把所有乘积相加得到b1.

最低0.47元/天解锁文章

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。