Squeeze-and-Excitation Networks
PDF: https://arxiv.org/pdf/1709.01507.pdf
PyTorch代码: https://github.com/shanglianlm0525/PyTorch-Networks
Squeeze-and-Excitation Networks(SENet)是由自动驾驶公司Momenta在2017年公布的一种全新的图像识别结构,它通过对特征通道间的相关性进行建模,把重要的特征进行强化来提升准确率。这个结构是2017 ILSVR竞赛的冠军,top5的错误率达到了2.251%,比2016年的第一名还要低25%,可谓提升巨大。
1 概述
- SENet通过学习channel之间的相关性,筛选出了针对通道的注意力,稍微增加了一点计算量,但是效果提升较明显
- Squeeze-and-Excitation(SE) block是一个子结构,可以有效地嵌到其他分类或检测模型中。
- SENet的核心思想在于通过网络根据loss去学习feature map的特征权重来使模型达到更好的结果
- SE模块本质上是一种attention机制