CBAM 论文笔记

最新推荐文章于 2024-05-27 12:49:39 发布

Tianchao龙虾

最新推荐文章于 2024-05-27 12:49:39 发布

阅读量895

点赞数

分类专栏：网络Tricks 文章标签：深度学习神经网络计算机视觉

本文链接：https://blog.csdn.net/wuchaohuo724/article/details/120741939

版权

网络Tricks 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

CBAM: Convolutional Block Attention Module

CBAM ECCV 2018

论文链接: https://arxiv.org/abs/1807.06521

一、 Problem Statement

SE block只关注于channel-wise attention，但是忽略了spatial-wise attetion。作者融合了这两个，提升SE Module的性能。

二、 Direction

通过Convolutional Block Attention Module提升模型的表征能力。作者从两个维度出发:

channel attention module
spatial attention module

第一个学习"what" to attend，第二个学习"where" to attend。

三、 Method

先来看一下整体的流程:

可以看到模块分为两个部分:

Channel Attention Module
Spatial Attention Module

假设我们有一个feature map $\in \R^{C \times H \times W}$ 作为输入，CBAM会首先会根据这个输入，通过Channel Attention Module生成一个1D channel attention map $M_c \in \R^{C \times 1 \times 1}$ ，然后这个channel attention map会与原始输入进行element-wise multiplication。
$M_c (F) \otimes F$
第二部，得到 $F^{'}$ 输出后，將其输入到后续的Spatial Attention Module，生成一个2D的spatial attention map, 维度为 $M_s \in \R^{1 \times H \times W}$

$M_s (F') \otimes F'$

具体两个模块的内容如下:

1. Channel Attention Module

Channel attention module探索的是特征中inter-channel的关系。channel attention关注的是给定一个输入图片，“what” is meaningful。具体操作如下所示:

Squeeze the spatial dimension。
同时使用average-pooling 和 maxpooling，生成 $F_{avg}^c$ 和 $F_{max}^c$ 描述子。
將两个描述子输入到一个shared network(MLP)。
通过element-wise summation进行融合，产生channel attention map $M_c \in \R^{C \times 1 \times 1}$ 。

公式演示为:
$\begin{aligned} M_c(F) &= \sigma (MLP(AvgPool(F)) + MLP(MaxPool(F))) \\ &=\sigma(W_1(W_0(F_{avg}^c))+W_1(W_0(F_{max}^c))) \end{aligned}$

2. Spatial Attention Module

下面来看一下Spatial Attention Module。这个模块关注的是: “where” is an informative part。具体流程如下图所示:

输入上面的输出 $F^{'}$ ，使用两个pooling操作，产生两个2D特征图: $F_{avg}^s \in \R^{1\times H \times W}, F_{max}^s \in \R^{1\times H \times W}$ 。
拼接上面两个2D 特征图后，进行标准卷积操作，产生一个2D spatial attention map。

公式演示如下:
$\begin{aligned} M_s(F) &= \sigma(f^{7 \times 7}([AvgPool(F); MaxPool(F)]))\\&=\sigma(f^{7 \times 7} ([F_{avg}^s; F_{max}^s])) \end{aligned}$

3. Arrangement of attention modules

上面两个模块如何放置，作者进行了实验。实验表明，channel-first order 和串联排列是最优的选择。

四、 Conclusion

SE模块只关注了inter-channel的关系，而CABM模块关注了inter-channel和inter-spatial的关系。如果CABMchannel attention module仅仅使用average pooling就和SE block一样了。通过实验，证明了CABM提升了网络表征能力。可以简单高效地嵌入到ResNet，MobileNet等网络中。

Reference

Tianchao龙虾

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
CBAM 论文笔记

CBAM: Convolutional Block Attention Module CBAM ECCV 2018论文链接: https://arxiv.org/abs/1807.06521一、 Problem StatementSE block只关注于channel-wise attention，但是忽略了spatial-wise attetion。作者融合了这两个，提升SE Module的性能。二、 Direction通过Convolutional Block Attention Modul
复制链接

扫一扫