特征图注意力_论文阅读(注意力模块)

a3ca6866cfc1df24941f595070907273.png
CBAM: Convolutional Block Attention Module
Sanghyun Woo*1, Jongchan Park*†2, Joon-Young Lee3, and In So Kweon1
1 Korea Advanced Institute of Science and Technology, Daejeon, Korea
{shwoo93, iskweon77}@kaist.ac.kr
2 Lunit Inc., Seoul, Korea
jcpark@lunit.io
3 Adobe Research, San Jose, CA, USA
jolee@adobe.com

1. 现有网络架构设计思路

  • Depth

将模块堆叠,提高网络深度,如ResNet

  • Width

提高卷积层的输出维度,增加特征图的通道数,如 GoogLeNet

  • Cardinality

基于分组的方式,采用多分支结构(多种感受野),如ResNeXt

2. 本文模型设计思路

  • Attention

通过使用注意力机制提高模型表达能力:关注重要特征,抑制不必要的特征。

3. 本文方法

因为卷积操作提取的特征信息是跨通道信息和空间的混合,因此本文提出Convolutional Block Attention Module(CBAM),增强这两个维度有意义的信息。

实现手段是有序地使用通道注意力模块和空间注意力模块,so that each of the branches can learn ‘what’ and ‘where’ to attend in the channel and spatial axes respectively(原文)。

  • 整体结构

343b636fb1d7a51620578a4594b2c4bc.png
  • 整体结构详述

a35088bf5286d1b130b196ffe19b7af7.png

给定一个输入特征图

,
CBAM有序推出一维通道注意力图
和二维空间注意力图
,整个处理过程可以概括如下:

其中

表示element-wise multiplication。

在做乘法的过程中,注意力值也相应广播(broadcast):通道注意力沿着空间维度广播,反之亦然。

  • 通道注意力模块详述

作者利用特征在通道间的关系,产生通道注意力图。因为特征图的每个通道维度都可看作是一个特征检测器,因此通道注意力关注的是:"what" is meaningful。

计算过程:为了高效计算通道注意力,作者压缩(squeeze)了输入特征图的空间维度。聚合空间维度的手段通常使用平均池化。但是作者表示最大池化也能够收集另一类重要的辨别信息,从而获得更优的通道级注意力。因此作者以并行的方式综合使用两种池化方式。然后连接共享的三层MLP,最后做一个激活操作得到通道注意力图。具体操作如下(权重共享):

  • 空间注意力模块详述

作者利用特征在空间位置上的关系,产生空间注意力图。空间注意力关注的是: "where" is an informative part,与通道注意力互补。

计算过程:作者首先压缩通道维度,在通道维度上进行平均池化和最大池化操作,然后将它们concat以获得更高效的特征描述子。在通道维度上应用池化操作是强调信息丰富区域非常有效的手段。最后通过将concat后的特征图卷积,生成空间注意力图。具体操作如下:

  • 注意力模块的组织

作者观察到有序使用两种模块比并行使用效果更好,并且顺序是:通道注意力模块->空间注意力模块。

4.实验

0f45711de734344643b9df1947859fd1.png

作者将CBAM集成到ResBlock中,进行了如下对照实验:

  • 纵向比较

a6061fb2665a404c7f0a0780b363055c.png

410256d7197b12b5c1410cf1f9b10579.png

ed168ff6ce154bcf1829ae4da8ea08fd.png
  • 横向比较

2dc541a5bd08be82a15a214ed033f2ff.png

8c70f71ffc4bec781b18337941349a7c.png
  • 使用 Grad-CAM 可视化

39809e36d4e33ec653b8c3df21760287.png

390e5831080d6afa542604c88a242fb0.png

Grad-CAM将最后一层卷积的输出可视化。p代表真实类别的softmax得分。

  • 模型可解释性的定量评估

e7c1464f3b24769c26571b260ef33a7e.png
  • 目标检测任务上的表现

3bdf1630a7d9212affa6f016c0370a48.png
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值