Self-Attention GAN的一些理解

最新推荐文章于 2024-08-09 08:26:54 发布

Zamirquito

最新推荐文章于 2024-08-09 08:26:54 发布

阅读量9.7k

点赞数 4

分类专栏： python cnn deep learning

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_26414307/article/details/85112217

版权

本文探讨Self-Attention GAN的工作原理，它通过重新分配权重来增强feature map的全局信息，弥补小卷积核的局限。通过1x1卷积、softmax等操作，生成attention map，实现特征点之间的相互影响，类似于全连接层在卷积网络中的作用。

摘要由CSDN通过智能技术生成

其实那么多的attention机制，说白了就是一句话，重新分配权重，比如说现在有一个n维向量[x1, x2, x3..., xn]，我觉得x1的值不足以代表其真实情况，所以希望利用x2,...xn的值来对其进行“修补”, 然后就是要找到一组权重w1, w2, w3...wn, 对其求加权平均（也不一定是加权平均，看实际需求）来得到x1的最终值（当然，实际应用中会涉及到一些维度映射，Query-Key-Value等内容，但大体框架都基于此）。

而Self-Attention GAN与之前的non local neural network极为相似（换了个皮？），以下为一些理解。

对于当前得到的feature map X（shape=[C, N]，C为channel， N为特征点数，例如在12*12图像中，将其展平，就得到144个特征点），我希望其能够得到更加全局的信息来弥补小卷积核信息获取不足的缺陷。

SAGAN

根据上图，对于feature map X，上面两路是获取attention map, 下面一列是一个线性变换，最后相乘得到最终结果。

对于第一路（f(X)那一行）,首先X经过一个1x1 卷积，得到f(x) (shape=[C/8, N]，C/8是文中的参数，可自由替换，个人理解是为了减少计算量设置的), 而第二路

最低0.47元/天解锁文章

关注

4
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Zamirquito CSDN认证博客专家 CSDN认证企业博客

码龄10年

6: 原创

40万+: 周排名

206万+: 总排名

3万+: 访问

: 等级

483: 积分

19: 粉丝

26: 获赞

12: 评论

122: 收藏

私信

关注

热门文章

分类专栏

C++
python 5篇
numpy 4篇
array 1篇
deep learning 4篇
cs231n 4篇
cnn 1篇
convolution

最新评论

cs231n-assignment2的笔记
Master_Ketation: batchnorm_backward_alt可以合并同类项来实现，而且还能利用cache中已有的数据进行替换
python中numpy的stack、vstack、hstack、concatenate、
qq_31280207: 有个小笔误：b.T的shape应该为（2,1）而不是（1,2）
cs231n-assignment1的笔记
Enigmalgia 回复 qq_40508812: 哈哈哈哈哈说出了我的心里话博主太赞了
cs231n-assignment1的笔记
qq_40508812: 真的非常棒。看了一大堆，全他妈的抄的，抄还不抄全，让人难以理解。真心感谢博主分享。
cs231n-assignment1的笔记
qq_27513771: 博主的这个作业1是我看见分析的最好的。谢谢你的分享

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。