有的时候我们为了使用比较深的神经网络训练cifar-10数据集。
这时,就不得不对resolution=32*32 的图像进行放大。来适应更深的 neutral network。
图像放大主要方法是差值。常用方法包括:线性插值,双线性插值,双三次插值。
本文就几种常用的插值方法讨论他们对神经网络训练的结果的影响。以图像检索为例。
1、单纯比较几种方法性能优劣
method | 计算量 | 插值结果 |
---|---|---|
nearest | 最少 | 没考虑其他相邻像素点的影响,因而重新采样后灰度值有明显的不连续性,图像质量损失较大,马赛克和锯齿现象 |
bilinear | 中等 | 考虑临近4个点,不会出现像素值不连续的的情况,由于双线性插值具有低通滤波器的性质,使高频分量受损,所以可能会使图像轮廓在一定程度上变得模糊 |
bicubic | 最大 | 考虑周围16个点,插值放大后损失最小,计算量大 |
2、用插值后的数据训练。
将原图【32*32】放大了49倍的结果进行训练 resize之后【224*224】。调优模型VGG_F model,在cifar-10上