一、概述
卷积神经网络中,卷积层和池化层导致了最终层学习到粗糙的,高度语义化的特征。但是,在识别像瓶子,遥控器小物体时,更需要诸如水平及竖直边缘这样的细节特征。而这些细节特征正是卷积神经网络在位置靠前的卷积层所要学习的。
为了捕捉这些细节特征,各种skip connection方法很流行。但是简单的融合高维度skip feature由于维度灾难导致的过拟合,并不会明显提升网络性能。那么,解决方案就在top-down modulation里。我们用一个自顶向下的神经网络补充经典的自底向上的前馈网络,用侧向连接连接它们。这些连接是用来调制和选择底层特征,而自顶向下的神经网络负责融合特征。经典前馈卷积网络获取的高层语义特征,由自顶向下的网络反馈回来,经过侧向连接处理后,在中间层与原特征融合,进一步向下传递。最终这些特征继承地拥有了局部及更大的感受野。本方法使用InceptionResNet-v2的初步实验得到了36.8的平均准确率,这是不用多尺度迭代改善的单个模型的最佳结果。并且,在小物体识别上获取了极大提升,说明了基于高层语义的细节特征提取很重要。
二、网络解析
2.1 网络结构及单元结构
网络结构设计如图:
图1 网络整体结构
核心思想