CBAM

最新推荐文章于 2024-04-19 16:00:15 发布

cdknight_happy

最新推荐文章于 2024-04-19 16:00:15 发布

阅读量369

点赞数

分类专栏： CNN- 分类

本文链接：https://blog.csdn.net/cdknight_happy/article/details/107964019

版权

CNN- 分类专栏收录该内容

27 篇文章 1 订阅

订阅专栏

论文：https://arxiv.org/pdf/1807.06521.pdf

1 CBAM

1.1 综述

在这里插入图片描述
CBAM，Convolutional Block Attention Module，卷积块的注意力模块。即包含了时间注意力模块，也包含了空间注意力模型。时间注意力模块用于决定各滤波器的作用大小，空间注意力模块用于决定哪些图像位置包含我们感兴趣的目标。

CBAM的输入是 $\in R^{C \times H \times W}$ ，先将输入和 $M_c \in R^{C \times 1 \times 1}$ 的channel attention map进行逐通道相乘，然后再将输出和 $M_s \in R^{1 \times H \times W}$ 进行逐点相乘，得到最终的输出。处理过程可以表示为：
在这里插入图片描述

1.2 channel attention module

channel attention module是在SENet基础的改进。SENet中sequeeze环节只使用了平均池化，本文作者则是同时使用了最大池化和平均池化。

输入 $\in R^{C \times H \times W}$ 经过最大池化后得到输出 $F_{max}^c \in R^{C \times 1 \times 1}$ ，经过平均池化后得到输出 $F_{avg}^c \in R^{C \times 1 \times 1}$ ，这两个输出经过同一个MLP网络(也就是Excitation操作，channel数先压缩再扩充)，之所以使用同一个MLP是为了不增加模型的训练参数，两个输出相加再经过sigmoid函数得到channel attention的结果。
在这里插入图片描述 $W_0 \in R^{C/r \times C},W_1 \in R^{C \times C/r}$ ， $W_0$ 之后还进行了ReLU操作。

在这里插入图片描述

实验证明了作者采用的channel attention module的优越性。

1.3 Spatial Attention Module

对channel attention之后的输出 $\in R^{C \times H \times W}$ 分别沿channel方向进行平均池化和最大池化，得到 $F_{avg}^s \in R^{1 \times H \times W}$ 和 $F_{max}^s \in R^{1 \times H \times W}$ ，将两者concatenate之后，经过一个卷积层channel数变成1，然后再经过sigmoid函数得到各个像素位置的重要程度，即spatial attention map。

在这里插入图片描述

实验证明了作者方案的有效性，并且卷积核为7 * 7的效果更好，作者认为更大的感受野有助于发现空间上更重要的region。

1.4 两个attention module的使用顺序

在这里插入图片描述先channel attention，后Spatial attention，效果更优。

2 实验

在这里插入图片描述

CBAM对分类检测任务的多个模型和数据集具有广泛的有效性。

cdknight_happy

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
CBAM

论文：https://arxiv.org/pdf/1807.06521.pdf1 CBAM1.1 综述CBAM，Convolutional Block Attention Module，卷积块的注意力模块。即包含了时间注意力模块，也包含了空间注意力模型。时间注意力模块用于决定各滤波器的作用大小，空间注意力模块用于决定哪些图像位置包含我们感兴趣的目标。CBAM的输入是F∈RC×H×WF \in R^{C \times H \times W}F∈RC×H×W，先将输入和Mc∈RC×1×1M_c \in
复制链接

扫一扫