注意力机制

最新推荐文章于 2023-05-08 19:44:56 发布

upupqlj

最新推荐文章于 2023-05-08 19:44:56 发布

阅读量230

点赞数

分类专栏：注意力机制机器学习序列生成模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/To_conquer_or_to_die/article/details/104748771

版权

注意力机制同时被 3 个专栏收录

3 篇文章 0 订阅

订阅专栏

序列生成模型

3 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

序列到序列常见的有3种：基于神经网络的序列到序列模型、基于注意力的序列到序列模型、基于自注意力的序列到序列模型参考nndl 15.6节

基于注意力的序列到序列模型

原理

链接：李宏毅视频 https://www.bilibili.com/video/av26543556?p=2
在这里插入图片描述
$z^0$ 是可以学习的参数，分别计算 $z^0$ 和 $h^1$ 、 $h^2$ 、 $h^3$ 、 $h^4$ 的相似性（可以计算余弦相似性，也可以是nn或其它），通过softmax进行归一化得到权重，然后计算 $c^0$

类似地计算出 $c^1$

基于自注意力的序列到序列模型

参考1:https://www.jianshu.com/p/b1030350aadb(包含了一些图帮助理解并有代码实现)
参考2：https://blog.csdn.net/longxinchen_ml/article/details/86533005(十分详细的介绍)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
注意力机制

原理链接：李宏毅视频 https://www.bilibili.com/video/av26543556?p=2z0z^0z0是可以学习的参数，分别计算z0z^0z0和h1h^1h1、h2h^2h2、h3h^3h3、h4h^4h4的相似性（可以计算余弦相似性，也可以是nn或其它），通过softmax进行归一化得到权重，然后计算c0c^0c0类似地计算出c1c^1c1...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。