自注意力机制（Self-attention）

zZhan7

已于 2023-09-06 20:25:24 修改

阅读量199

点赞数

文章标签：人工智能深度学习

于 2023-09-06 20:22:40 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w65353/article/details/132721295

版权

一、Self-attention

运作过程简述：输入一定长度的向量序列，输出同样数量的向量，并且输出的每个向量都会考虑整个sequence的信息。

Self-attention可以叠加很多次，和FC交替使用。

Self-attention：处理整个sequence的资讯。
FC：专注于处理某一位置的资讯。

运作过程-图示详解：输入一定长度的向量序列，输出同样数量的向量，并且输出的每个向量都会考虑整个sequence的信息。

input：a1，a2，a3，a4
output：b1，b2，b3，b4 （每个bi都是考虑了所有的ai产生）。并不需要依序产生，b1，b2，b3，b4同时计算

举例如何产生b1：根据a1，找出sequence里与a1相关的其他向量，即哪些向量和判断a1是哪个class/regression数值时所需要用到的。用 α 表示每个向量与a1的关联程度

Self-attention如何决定两个向量之间的关联性？即如何计算attention

在Self-attention中计算向量的关联性：

α：attention score，表示各向量与a1的关联性。

α' ：经过softmax后，相当于权重，用于抽取sequence中与a1相关的重要资讯。

某向量的attention score越大，该向量的v就越接近抽取出的结果b

运作过程-公式详解：

Self-attention输入是I，输出是O

二、Multi-head Self-attention

相关性：Self-attention用q去找相关的k

因为相关性是具有多种不同的定义与形式，需要有不同的q，每个q负责不同种类的相关性。

三、Positional Encoding

Self-attention没有考虑位置的信息。

如何在Self-attention考虑位置的信息？？？为每个位置设定一个唯一的位置向量 ei

四、Self-attention在图像方面的应用

之前，把一张图片看成一个很长的向量

其实，一张图片也可看做是一个vector set，即把每一个pixel看作一个三维向量

Self-attention & CNN

CNN可看作简化版的Self-attention

因为CNN只考虑卷积核大小内部的资讯，而Self-attention考虑的是整张图片资讯

Self-attention可看作复杂化的CNN

CNN中的卷积核大小是人决定的，而Self-attention自己找出与相关的像素，类似于自动学出卷积核的形状

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
自注意力机制（Self-attention）

自注意力机制Self-attention
复制链接

扫一扫

zZhan7 CSDN认证博客专家 CSDN认证企业博客

码龄4年

1: 原创

89万+: 周排名

196万+: 总排名

198: 访问

: 等级

10: 积分

0: 粉丝

0: 获赞

1: 评论

1: 收藏

私信

关注

热门文章

自注意力机制（Self-attention） 199

最新评论

自注意力机制（Self-attention）
CSDN-Ada助手: 恭喜您开始博客创作！标题“自注意力机制（Self-attention）”引人入胜，让读者对您的文章产生了浓厚的兴趣。自注意力机制是一个相当有趣且受欢迎的话题，您以简洁明了的方式介绍了它，让读者对该主题有了初步的了解。接下来，我建议您可以深入探讨自注意力机制的应用领域，或者与其他相关领域进行对比，以便读者更好地理解和应用自注意力机制。期待阅读您的下一篇博客！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。