为什么每张图片都要减去mean值呢?
在计算机视觉领域中,一定免不了的就是图像预处理中的 逐个样本减去mean值的过程,那么为什么一定要做这一步呢?
其主要的原因就是,对于我们的自然图像其实是一种平稳的数据分布【即图像的每一维都服从相同的分布】。所以通过减去数据对应维度的统计平均值,来消除公共的部分,以凸显个体之间的特征和差异。下面就用一个图来直观的表示一下:
可以看到减去均值后的图b,天空的纹理被消除了,凸显出了图片中的车和高楼等主要特征
需要注意的是:用来计算均值的,一定要用训练集,否则违背了深度学习的原则(即模型训练仅能从训练数据中获取信息)。对于得到的mean值,训练集、验证集和测试集都要分别减去均值。
附上代码
# 首先,你需要安装numpy和opencv模块。
# opencv 可以通过下面的命令来直接安装。
pip install opencv-python
该代码,只需修改文件路径即可。
import os
import numpy as np
import cv2
# 这个是你图片的根目录,注意不要带中文路径,楼主就因