文章目录
摘要
卷积神经网络(cnn)的核心构建块是卷积算子,它使网络能够通过在每层的局部接受域中融合空间和通道信息来构建信息特征。之前的广泛研究已经调查了这种关系的空间成分,试图通过提高整个特征层次的空间编码质量来加强CNN的表征能力。在这项工作中,我们将重点放在通道关系上,并提出了一种新的架构单元,我们称之为“挤压和激励”(SE)块,该单元通过明确建模通道之间的相互依赖性,自适应地重新校准通道特征响应。我们表明,这些块可以堆叠在一起,形成SENet架构,在不同的数据集上非常有效地泛化。我们进一步证明,SE块在略微增加计算成本的情况下,为现有最先进的cnn带来了显著的性能改进。压缩和激励网络构成了我们2017年ILSVRC分类提交的基础,该分类提交获得了第一名,并将前5名的错误率降低到2.25%,比2016年的获奖作品相对提高了25%。模型和代码可在https://github.com/hujie-frank/SENet上获得。
索引术语:压缩和激励,图像表示,注意,卷积神经网络。
1、简介
卷积神经网络(cnn)已经被证明是处理各种视觉任务[1],[2],[3],[4]的有用模型。在网络中的每个卷积层,一组滤波器沿着输入通道表达邻近的空间连接模式,在局部接受域中融合空间和通道信息。通过将