构建CNN框架的主流block(一)——SE和CBAM

最新推荐文章于 2024-05-15 02:40:33 发布

小木虫1314

最新推荐文章于 2024-05-15 02:40:33 发布

阅读量1.1w

点赞数 15

分类专栏：深度学习卷积神经网络（CNN）系列文章标签： SE CBAM 卷积神经网络

本文链接：https://blog.csdn.net/qq_36501027/article/details/95213561

版权

深度学习同时被 2 个专栏收录

5 篇文章 0 订阅

订阅专栏

卷积神经网络（CNN）系列

3 篇文章 0 订阅

订阅专栏

SENET是2017年的世界冠军，CBAM是2018年的分类冠军，它和SE一样也是一个模型，现在任何流行网络都可以嵌入这个模块。

博主只是简单的赘述一下这些模块的思想，写一个笔记，做一个 state-of-art 的搬运工, 如有错误请各位大佬指点批评！！！

SE
SE全称Squeeze-and-Excitation，它注重通道信息。
在这里插入图片描述
SE的出现是为了解决在卷积池化过程中feature map的不同通道所占的重要性不同带来的损失问题。在传统的卷积池化过程中，默认feature map的每个通道是同等重要的，而在实际的问题中，不同通道的重要性是有差异的，具体问题具体看待。
如上图所示，SE的结构较为清晰，具体的卷积池化过程如下图所示，下图是一个残差块中加入了SE模块的结构。
假设输入的是一个 h * w * c 的 feature map,首先对它进行一个 global average pooling ，由全局池化（池化大小为 h * w）的操作我们可以得到一个 1 * 1 * c 的 feature map ，然后就是两个全连接层，第一个全连接层的神经元个数为 c/16（作者给的参数），这就是一个降维的方法，第二个全连接层又升维到了 C 个神经元个数，这样做的好处是增加了更多的非线性处理过程，可以拟合通道之间复杂的相关性。然后再接一个sigmod层，得到 1 * 1 * c 的 feature map，最后就是一个原始的h * w * c 和 1 * 1 * c 的 feature map 全乘的操作。之所以是全乘不是矩阵相乘，那是因为这样可以得到不同通道重要性不一样的 feature map。（可以了解矩阵全乘和矩阵相乘的概念和计算方法）
在这里插入图片描述

CBAM
CBAM全称为 Convolutional Block Attention Module，它是一个卷积注意力机制模块，比SE多了一个空间（spatial）attention，两全其美。
在这里插入图片描述
如上图所示，CBAM可分为2部分，先是channel attention ，和SE类似，然后是 spatial attention，它融合了2种注意力机制，可添加在任意网络的卷积层后面。下面逐一介绍2个部分。

上图是CBAM的 channel attention的过程，不难看出它比SE多了一个 global max pooling（池化本身是提取高层次特征，不同的池化意味着提取的高层次特征更加丰富）。其2个池化之后的处理过程和SE一样，都是先降维再升维，不同的是将2个池化后相加再sigmod和原 feature map相乘输出结果。
在这里插入图片描述
上图是 spatial attention 的过程。它是将做完 channel attention 的feature map 作为输入，之后作2个大小为列通道的维度池化，每一次池化得到的 feature map 大小就为 h * w * 1 ，再将两次池化的 feature map 作基于通道的连接变成了大小为 h * w * 2 的 feature map ，再对这个feature map 进行核大小为 7*7 ，卷积核个数为1的卷积操作（通道压缩）再sigmod，最后就是熟悉的矩阵全乘了。

参考博客链接

小木虫1314

关注

15
点赞
踩
62

收藏

觉得还不错? 一键收藏
0
评论
构建CNN框架的主流block(一)——SE和CBAM

SENET是2017年的世界冠军，CBAM是2018年的分类冠军，它和SE一样也是一个模型，现在任何流行网络都可以嵌入这个模块。博主只是简单的赘述一下这些模块的思想，如有错误请各位大佬指点批评！！！SESE全称Squeeze-and-Excitation，它注重通道信息。SE的出现是为了解决在卷积池化过程中feature map的不同通道所占的重要性不同带来的损失问题。在传统的卷积池化过...
复制链接

扫一扫