[TOC]
网络的图像输入,应该不拘泥于尺寸大小的才对,这是个朴素的想法。
1)为对抗多尺度问题
卷积操作对输入尺寸是无必须要求的,任意尺寸均可。
但是,如果加上全连接层,该层必须要求是固定尺寸的输入,那么问题就来了。怎么才能解决这种类似的问题呢。
1.1) 将全连接去掉
对最后的feature-map做global average pooling,直接加softmax。这篇文章里NIN,就是这么干的。
1.2)将变尺寸划为固定尺寸
在feature-map后,加入spatial pyramid pooling layer,将不固定尺寸变为固定尺寸。SPPnet, Faster R-CNN都是这样的思路。
1.3) 全部使用卷积层
比如FCN(Fully Conv Network),多尺寸输入完全不成问题。FCN,主要应用在图像语义切分上。
上面所说的这3种方法,都是在网络过程中解决多尺度问题,将变换尺寸translate为不变尺寸。