图像预处理后还会进行类似:
img = img - imagenet_mean
img = img / imagenet_std
利用均值和标准差来进行归一化处理。
在机器学习领域中,不同评价指标(即特征向量中的不同特征就是所述的不同评价指标)往往具有不同的量纲和量纲单位,这样的情况会影响到数据分析的结果,
为了消除指标之间的量纲影响,需要进行数据标准化处理,以解决数据指标之间的可比性。原始数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价。其中,最典型的就是数据的归一化处理。
归一化的目的就是使得预处理的数据被限定在一定的范围内(比如[0,1]或者[-1,1]),从而消除奇异样本数据导致的不良影响。
而使用Imagenet的均值和标准是一种常见的做法。如果你想在你自己的数据集上从头开始训练,你可以计算新的平均值和标准。否则,建议使用Imagenet预试模型自己的平均值和标准。
一般来说,如果是自然场景下的图片,使用Imagenet的场景统计数据进行规范化即可;若是非自然场景下的图片(医学图像,卫星地图,手绘),则可以在模型训练之前正确地规范化你的数据集(计算新的平均值和标准)。