本文重点
图片数据是计算机视觉处理的核心,一般的图片数据并不能直接放到神经网络中,而是应该使用一些数据与处理的方式来解决。常见的三种数据预处理的方式有:去均值,归一化,PCA/白化。
去均值
把图片各个维度(每个像素)都中心化到0,这里我们只求训练集的均值,然后用图片剪掉均值,这样就完成了去均值的操作,测试集的也减去训练集的均值。
去均值会使得数据均匀一些,目前均值的方式有两种方式:
以一个32*32*3的图片数据集为例,第一种方式是每一个像素点计算均值,也就是说我们要计算出32*32*3个均值。AlexNet就是这样
还有一种方式是每一个通道计算一个均值,那么这样就有3个均值,分别是三个通道上的均值。VGG就是这样
归一化
把数据归一化到同一范围,比如【0,1】等等,图片基本不做归一化,因为图片的数据像素范围都在0到255之间,都在同一范围,所以没有必要做归一化。
PCA/白化
PCA是用于降维,比如图片的shape比较大,那么此时可以降维,但是一般我们对图片处理的时候都是reshape,所以一般不用降维了。
白化: 白化是对数据每个特征轴上的幅度归一化
总结
以上就是图片数据处理的方式,但是常常只进行均值化操作,而基本不做标准化、PCA和白化 。