为什么CBAM通道与空间注意力模块顺序排列性能最好
《CBAM–Convolutional Block Attention Module》
《SENet——Squeeze-and-Excitation Networks》
CBAM的核心是结合通道注意力与空间注意力,文章的很多内容也是对比于以通道注意力机制为核心的SENet。
论文中有提到,将通道注意力与空间注意力模块以先通道再空间的顺序排列会得到最好的效果。
在通道注意力模块方面,
SENet: 进行了全局平均池化(AvgPool),
CBAM: 进行了全局平均池化和全局最大池化(AvgPool + MaxPool)。
全局平均池化常用于聚集空间信息,是对整个特征图进行平均池化,一张特征图最终得出一个值。
池化本身是提取高层特征,而不同的池化意味着提取的高层特征更丰富
所以能取得较好性能的原因:
1、由于加入了MaxPool,CBAM通道注意力模块在一定程度上弥补了AvgPool丢失的信息
2、卷积核具有局部性,即它只关注局部特征,局部的程度取决于卷积核的大小。在CBAM中,生成的二维空间注意力图使用卷积核大小为7的卷积层进行编码,选择了较大的卷积核,对保留重要的空间信息有很大帮助
上述的两点原因在这篇论文中也有提到《Attention-yolo:引入注意力机制的YOLO检测算法》