自注意力机制与注意力机制

最新推荐文章于 2024-06-24 17:46:02 发布

喝鸡汤

最新推荐文章于 2024-06-24 17:46:02 发布

阅读量5.7k

点赞数

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_53312564/article/details/127348114

版权

基本内容理解的话推荐看一下这篇博客Transformer：注意力机制（attention）和自注意力机制（self-attention）的学习总结，这个博主讲的很细致，比较容易理解。
这里借用一下上述博客的总结：

注意力可以分为两种方式分别是自主提示和非自主提示。其中非自主提示是键，自主提示是查询，物体原始向量是值。键和值是一一对应的。
注意力机制的评分函数可以对查询和键进行关系建模，获取查询和键的相似度匹配。其方法分为两种：加性注意力和点积注意力。常用的是点积注意力。
如果查询和键是同一组内的特征，并且相互做注意力机制，则称为自注意力机制或内部注意力机制。
多头注意力机制的多头表示对每个Query和所有的Key-Value做多次注意力机制。做两次，就是两头，做三次，就是三头。这样做的意义在于获取每个Query和所有的Key-Value的不同的依赖关系。
自注意力机制的优缺点简记为【优点：感受野大。缺点：需要大数据。】

我补充一下两种计算注意力的方式:
首先是加性注意力计算：
在这里插入图片描述
可以看到是将query与key进行线性相加后，通过tanh函数进行归一化之后得到了注意力系数矩阵。
对于点乘注意力计算

是将query与key进行相乘得到，之后会经过一层softmax进行归一化。

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
1
评论
自注意力机制与注意力机制

注意力计算图解
复制链接

扫一扫

喝鸡汤 CSDN认证博客专家 CSDN认证企业博客

码龄4年

25: 原创

17万+: 周排名

20万+: 总排名

5万+: 访问

: 等级

331: 积分

680: 粉丝

37: 获赞

20: 评论

196: 收藏

私信

关注

热门文章

分类专栏

HarmonyOs开发 4篇

最新评论

安装DevEco Studio时，遇到的ohpm报错（解决）（新增hello world报错）
南澂: 救我老命
安装DevEco Studio时，遇到的ohpm报错（解决）（新增hello world报错）
weixin_46428651: 真是救命命了感谢分享！！
安装DevEco Studio时，遇到的ohpm报错（解决）（新增hello world报错）
.ઇଓ.: 为什么我模拟器只输出hello world，换什么代码都输出hello world
【笔记】数据结构与算法 python-01-时间复杂度与空间复杂度
CSDN-Ada助手: 恭喜您写完了第18篇博客！标题看起来很有深度，内容一定也非常精彩。能够深入学习数据结构与算法并将其应用于Python编程是一项重要的能力，这将为您的技术发展打下坚实的基础。在下一步的创作中，或许您可以考虑从实际案例出发，通过编写具体的代码来展示时间复杂度和空间复杂度的应用。此外，您还可以尝试与读者进行互动，例如提供一些思考题或者编写一些小实验，以帮助读者更好地理解这些概念。再次恭喜您的连续创作，期待您的下一篇博客！请继续保持谦虚的态度，不断努力学习和分享知识，您一定能够取得更大的进步。
【笔记】数据结构与算法 python-00-数据结构基本概念与算法
CSDN-Ada助手: 恭喜您写了第19篇博客！标题中提到的数据结构与算法是一个非常重要且庞大的主题，您的努力和坚持值得赞赏。对于初学者来说，理解数据结构基本概念与算法是建立扎实编程基础的关键一步。接下来，我希望您能够继续探索更多相关的数据结构与算法内容，例如不同种类的数据结构（如链表、栈等）以及它们的应用场景和相应的算法。通过进一步的学习和实践，您将更加深入地理解这一领域，并能够为其他刚入门的读者提供更有价值的知识分享。期待您未来的创作！

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。