实现通道注意力_CVPR2020 图像识别之自注意力机制

最新推荐文章于 2024-07-29 17:29:05 发布

我是索吹

最新推荐文章于 2024-07-29 17:29:05 发布

阅读量1.9k

点赞数

文章标签：实现通道注意力

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30387211/article/details/112685426

版权

本文探讨了将自注意力机制应用于图像识别，通过解耦传统卷积，将特征聚集视为局部像素的加权求和。作者提出使用注意力机制动态生成卷积参数，扩展了考虑的局部区域，同时减少了参数数量。核心思想是根据像素间的关系计算注意力权重，用于聚集像素的特征。此外，文中还提到了像素块级别的注意力机制。

摘要由CSDN通过智能技术生成

Exploring Self-attention for Image Recognition

Exploring Self-attention for Image Recognitionarxiv.org

一文章出发点

现在哪哪都用的注意力。

文章认为传统的卷积可分为，特征聚集（空间卷积)+特征变化（通道卷积），实际也就是分通道独立卷积的思想。而且特征聚集中3*3卷积所考虑的空间大小固定，所以作者也提出将传统卷积解耦，然后将特征聚集的本质理解为：局部区域内的像素特征加权求和。所以作者提出利用注意力机制自动生成这个权（空间卷积参数），也就是以前的卷积参数，从而实现了增加所考虑的局部区域大小，而又不增加参数的目标。

二文章怎么做

文章通篇只有一张图，如下，也就是文章的基本卷积模块

为了便于理解，我这里将它画成了如下形式。图中某些箭头上方的符号都可以简单理解为一个类似1*1卷积层的操作。

所以文章的核心思想在于：考虑一个像素的局部特征聚集时，应该将注意力放在那些对它影响较大的像素上。因此根据当前像素与所考虑的局部区域内（文中称为footprint,大小7*7）各像素的关系（如下图所示点积的相似性啊、一范数等等），经1*1卷积得到该区域内各像素特征的注意力权重（如前所述，此时注意力权重有点类似传统的卷积参数，只是每次卷积参数不同，所以你会发现传统的3*3卷积核参数量没有了，只剩1*1卷积了，因为现在卷积核全是根据自注意力机制而来，所以卷积大小可以扩大很多）。

以上，作者除上述像素对之间的注意力，还提出了像素块与像素之间的注意力，感兴趣自读。

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。