图像白化
白化:去除输入数据的冗余信息。
假设训练数据时图像,由于图像中相邻像素之间具有很强的相关性,所以用于训练时输入时冗余的;白化目的就是降低输入的冗余性。
输入数据集X:经过白化处理后,新的数据X’满足两个性质:
(1) 特征之间相关性较低;
(2) 所有特征具有相同的方差。
PCA白化原理:我们把原始数据x,利用协方差矩阵Y求出特征向量u1,u2,我们把每
个向量归一化,这就是PCA白化。
举例说明:
所谓的pca白化是指对上面的pca的新坐标X’(映射到特征向量u1和u2后组成点),每一维的特征做一个标准差归一化处理。因为从上面我们看到在新的坐标空间中,(x1,x2)两个坐标轴方向的数据明显标准差不同,因此我们接着要对新的每一维坐标做一个标注差归一化处理:
当然你也可以采用下面的公式:
X'为经过PCA处理的新PCA坐标空间,然后λi就是第i维特征对应的特征值(前面pca得到的特征值),ε是为了避免除数为0。
3、ZCA白化
ZCA白虎是在PCA白化的基础上,又进行处理的一个操作。具体的实现是把上面PCA白化的结果,又变换到原来坐标系下的坐标:
给人的感觉就像是在PCA空间做了处理完后,然后又把它变换到原始的数据空间。
参考网址:https://blog.csdn.net/haoji007/article/details/52790189