Multi-Scale Dense Networks for Resource Efficient Image Classification
[ICLR2018 oral]
原文链接:传送门
目录
问题
- 在近几年的视觉物体识别任务上,有的物体很容易就可识别出来,而有的被遮挡的物体或者由于拍摄角度诡异,而很难识别的物体,在test的时候回消耗同样的计算资源。这对于大型的数据集来说,会产生会多不必要的计算资源浪费。
-
- 在一般的卷积神经网络中,倒数第二层的特征将直接输入到最后一层进行分类,其他层的特征将被忽视。
-
- 不同的卷积神经网络的层包含不同级别的scale信息。我们应该充分利用低维和高维特征。
解决方法
把每层的layer都连接到classification层
创建一个multi-scale的网络框架,让每层都包含不同的scale信息。
本文所创建的网络叫做Multi-Scale DenseNet (MSDNet)。
网络模型框架,自行参考原文figure 2.
个人理解
- 分类器的分类准确率与它使用第几层产生的feature来