SENet
Convolution
卷积核作为卷积神经网络的核心,通常被看作是在局部感受野上,将空间上(spatial)的信息和特征维度(channel-wise)的信息进行聚合的信息聚合体。卷积神经网络由一系列卷积层、非线性层和池化层构成,这样它们能从全局感受野上去捕获图像的特征来进行图像的描述。
Squeeze-and-Excitation Module
Sequeeze-and-Excitation(SE) block不是一个完整的网络结构,而是一个子结构,可以嵌入到其他分类或者检测模型中。核心思想在于通过网络根据loss去学习特征权重,使得有效的feature map权重大,无效或者效果小的feature map权重小的方式训练模型来达到更好的效果。虽然嵌入到其他网络中不可避免增加了一些参数和计算量,但是在效果面前还是可以接受。
SE-Inception模块结构
使用global average pooling作为squeeze操作。紧接着两个FC层组成一个Bottleneck结构来建模通道间的相关性,并输出和输入特征同样数目的权重。首先将特征维度降低到输入的1/16,然后经过ReLU激活后再通过一个FC层回升到原来的维度。好处:具有更多非线性,更好拟合通道见复杂的相关性;减少参数量和计算量。接着通过一个sigmoid的门获得01之间归一化的权重,最后通过一个scale的操作来将归一化的权重加权到每个通道的特征上。