实现通道注意力_CVPR2020 图像识别之自注意力机制

本文探讨了将自注意力机制应用于图像识别,通过解耦传统卷积,将特征聚集视为局部像素的加权求和。作者提出使用注意力机制动态生成卷积参数,扩展了考虑的局部区域,同时减少了参数数量。核心思想是根据像素间的关系计算注意力权重,用于聚集像素的特征。此外,文中还提到了像素块级别的注意力机制。
摘要由CSDN通过智能技术生成

Exploring Self-attention for Image Recognition

Exploring Self-attention for Image Recognition​arxiv.org

一 文章出发点

现在哪哪都用的注意力。

文章认为传统的卷积可分为,特征聚集(空间卷积)+特征变化(通道卷积),实际也就是分通道独立卷积的思想。而且特征聚集中3*3卷积所考虑的空间大小固定,所以作者也提出将传统卷积解耦,然后将特征聚集的本质理解为:局部区域内的像素特征加权求和。所以作者提出利用注意力机制自动生成这个权(空间卷积参数),也就是以前的卷积参数,从而实现了增加所考虑的局部区域大小,而又不增加参数的目标。

二 文章怎么做

文章通篇只有一张图,如下,也就是文章的基本卷积模块

2859068657e7f0df7e68636380d52980.png

为了便于理解,我这里将它画成了如下形式。图中某些箭头上方的符号都可以简单理解为一个类似1*1卷积层的操作。

671ba7468aa9479df52272345e2d6074.png

所以文章的核心思想在于:考虑一个像素的局部特征聚集时,应该将注意力放在那些对它影响较大的像素上。因此根据当前像素与所考虑的局部区域内(文中称为footprint,大小7*7)各像素的关系(如下图所示点积的相似性啊、一范数等等),经1*1卷积得到该区域内各像素特征的注意力权重(如前所述,此时注意力权重有点类似传统的卷积参数,只是每次卷积参数不同,所以你会发现传统的3*3卷积核参数量没有了,只剩1*1卷积了,因为现在卷积核全是根据自注意力机制而来,所以卷积大小可以扩大很多)

2b3e78f0a63eb888f50485466a807ac6.png

以上,作者除上述像素对之间的注意力,还提出了像素块与像素之间的注意力,感兴趣自读。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值