一、概要
CBAM是一种注意力实现机制,它结合了空间和通道两个维度上的信息进行注意力的实现,可以说是对SE的补充。SE解决了"what"的问题,而CBAM解决了"what + where"的问题。
二、整体结构
CBAM的整体结构如下,它串联了空间和通道两个维度的注意力信息,分别将空间通道注意力信息(通道加权)和空间注意力信息(空间位置加权)融合到CBAM的输入特征映射,输出融合了两个通道和空间注意力信息的特征映射。
三、通道注意力
SE中的通道注意力使用了全局平局池化来得到每个channel的权重,而CBAM则认为全局最大池化也是一种定位关键特征的重要途径,这貌似也符合我们的直觉。因此,CBAM中的通道注意力将两种池化方法进行了融合,具体如下图所示。