1、均值归一化
- 在一般的图像预处理过程中都会对图像进行减去mean,除以std操作。
- 需要注意的是:一定要用训练集计算出均值和方差,否则违背了深度学习的原则(即模型训练仅能从训练数据中获取信息)。对于得到的mean值,训练集、验证集和测试集都要分别减去均值。
2、为什么要均值归一化
在计算机视觉领域中,一定免不了的就是图像预处理中的 逐个样本减去mean值的过程,那么为什么一定要做这一步呢?
其主要的原因就是,对于自然图像,其是一种平稳的数据分布【即图像的每一维都服从相同的分布】。所以通过减去数据对应维度的统计平均值,来消除公共的部分,以凸显个体之间的特征和差异。下面就用一个图来直观的表示一下:
可以看到减去均值后的图b,天空的纹理被消除了,凸显出了图片中的车和高楼等主要特征
3、计算均值与方差
# 首先,