这篇论文的思想比较独特,从数据的训练集和测试集的输入分辨率着手进行分析,得出训练数据和测试数据的输入分辨率应该是不一样的,才能在图像分类上达到较好的精度。以前的大部分研究在网络输入的分辨率上基本上是一致的,然而由于训练数据和测试数据在预处理上的不同,导致了网络对图像的表观尺寸上是有偏差的,没有在测试集上达到最好的效果。
表观尺寸和分辨率对性能的影响
在图像分类的神经网络中,通常是接受一个固定大小的输入尺寸,比如,AlexNet的输入分辨率是 224 × 224 224\times224 224×