Self Attention

最新推荐文章于 2022-02-07 15:26:41 发布

xdqiangdd

最新推荐文章于 2022-02-07 15:26:41 发布

阅读量193

点赞数

文章标签：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xdqiangdd/article/details/119212918

版权

1. self attention

在这里插入图片描述
通过输入a1 a2 a3 a4到self attention中，会计算互相之间的相似度。
b1为a1考虑了a2,a3,a4所有的信息之后的输出的a1…

1.1 怎么产生b1?

在这里插入图片描述

根据a1找出与a1相关的所有其他向量，用阿尔法表示相关度。
计算相关度的方法：

Dot-product(主要)
Additive

有两个权重矩阵Wq,Wk分别用于生成q(qury)，k(key)。
qi = Wq·ai
ki=Wk·ai
αi,j=qi · kj

计算出相关性后，做softmax()，也可以用其他激活函数：relu()…

获得a’1,1，a’1,2，a’1,3，a’1,4后我们就知道哪些向量和a1最相关。
vi=Wv · ai
把vi和上一步得到的α’i,j相乘

1.2 矩阵操作

Q=Wq · I
K=Wk · I
V=Wv · I

在这里插入图片描述
黄色的k表示k的转置transpose
综合一下得到:
α1=K· q1
α2=K· q2
α3=K· q3
α4=K· q4

再组合一下：
α=KT · Q (T为转置)

self attention的输出为O
O=V · A'

1.3 结论

在这里插入图片描述
只有三个矩阵参数需要学习

2.Multi-head Self-attention

在实际中，求相关性方法有许多种。
在这里插入图片描述
多个head之间独立运算，最后把两个head的输出接起来

3.Positional Encoding

在self attention中没有位置信息：
a之间没有位置信息，不知到a出现的顺序
可以为a添加一个人工的位置信息：ei
在这里插入图片描述
e的可视化：
每一列表示一个e

4.Self-attention for Image

在这里插入图片描述

4.1 Self-attention V.S. CNN

在这里插入图片描述

CNN: 只是考虑感受野内的像素相关性
Self attention：考虑整个图片像素的相关性
CNN是Self attention的一部分，只要Self Attention设定合适，可以完全取代CNN
在这里插入图片描述
CNN和self attention的对比实验发现：
数据量少时：CNN效果好
数据量大时：Self-attention 效果更好

4.2 Self-attention V.S. RNN

在这里插入图片描述

5.Self -attention for Graph

在这里插入图片描述

6.Self attention变体

在这里插入图片描述

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

xdqiangdd CSDN认证博客专家 CSDN认证企业博客

码龄4年

13: 原创

107万+: 周排名

139万+: 总排名

1万+: 访问

: 等级

152: 积分

1: 粉丝

7: 获赞

5: 评论

33: 收藏

私信

关注

热门文章

分类专栏

软件设计师 1篇
uml 1篇

最新评论

pytorch加入高斯噪声和椒盐噪声
Ray Han: 用了一段时间才发现一些问题： 1. amplitude=random.uniform(0, 45)这个随机不是真的随机，只是在这个类实例化的时候随机。之后调用这个类时，是按照实例化后的定值添加的。容易误解 2. 看手册里面np.random.normal的scale参数是标准差，楼主写成方差（variance）了，容易误解 3. 幅值的表述其实容易让人不理解，一个高斯噪声完全可以只用均值和方差描述，不需要幅值参数。当然幅值可能会方便使用
pytorch加入高斯噪声和椒盐噪声
Ray Han: 用class的这种封装方法，用在pytorch里很方便
pytorch加入高斯噪声和椒盐噪声
Manigoldo_: where is pytorch
二值图进行resize后像素值会发生变化，不再是二值图！！！
xdqiangdd: [code=python] transforms.Resize(size=128,interpolation = 0), [/code]
二值图进行resize后像素值会发生变化，不再是二值图！！！
Nuomimi_cc: 那应该怎么处理数据啊，博主有好的建议吗

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。