白化(Whitening) PCA白化 ZCA白化

白化是一种重要的预处理过程,其目的就是降低输入数据的冗余性,使得经过白化处理的输入数据具有如下性质:(i)特征之间相关性较低;(ii)所有特征具有相同的方差

 

白化处理分PCA白化和ZCA白化,PCA白化保证数据各维度的方差为1,而ZCA白化保证数据各维度的方差相同。PCA白化可以用于降维也可以去相关性,而ZCA白化主要用于去相关性,且尽量使白化后的数据接近原始输入数据。


1. PCA白化

 根据白化的两个要求,我们首先是降低特征之间的相关性。在PCA中,我们选取前K大的特征值的特征向量作为投影方向,如果K的大小为数据的维度n,把这K个特征向量组成选择矩阵U(每一列为一个特征向量),为旋转后的数据。如果K<n,就是PCA降维,如果K=n,则降低特征间相关性降低。


                                  原始数据                                               PCA旋转

上图显示了原始数据和经过PCA旋转之后的数据,可以发现数据之间的相对位置都没有改变,仅仅改变了数据的基,但这种方法就降低了数据之后的相关性。(原始数据的相关性为正,因为x1增加时,x2也增加;而处理之后的数据的相关性明显降低)

 

第二个要求是每个输入特征具有单位方差,以直接使用作为缩放因子来缩放每个特征,计算公式,经过PCA白化处理的数据分布如下图所示,此时的协方差矩阵为单位矩阵I。

 

                                           PCA白化                                     ZCA白化

2. ZCA白化

ZCA白化的定义为:

         

ZCA白化只是在PCA白化的基础上做了一个旋转操作,使得白化之后的数据更加的接近原始数据。

ZCA白化首先通过PCA去除了各个特征之间的相关性,然后是输入特征具有单位方差,此时得到PCA白化后的处理结果,然后再把数据旋转回去,得到ZCA白化的处理结果,感觉这个过程让数据的特征之间有具有的一定的相关性,下面实验进行验证。

 

在实验中,我分别计算了原始数据,旋转后数据,PCA白化以及ZCA白化的协方差矩阵,数据用的是UFLDL的实验数据,是个协方差矩阵分别为:

 

从上面的4个协方差矩阵可以发现,正如上面所述,旋转之后降低了特征之间的相关性,rotate协方差矩阵的主对角线以为的值都接近零。我猜测ZCA白化后的数据的相关性会比PCA白化的要强,在该实验室中表明好像我的感觉是对的,ZCA白化后主对角线以外的值的绝对值大于PCA白化后(今天看了下发现这个有问题),虽然这种比较可以忽略不计,应该他们的值都是非常的接近的。


3. PCA白化和ZCA白化的区别

PCA白化ZCA白化都降低了特征之间相关性较低,同时使得所有特征具有相同的方差。

1.   PCA白化需要保证数据各维度的方差为1,ZCA白化只需保证方差相等。

2.   PCA白化可进行降维也可以去相关性,而ZCA白化主要用于去相关性另外。

3.   ZCA白化相比于PCA白化使得处理后的数据更加的接近原始数据。


4. 正则化

实践中需要实现PCA白化或ZCA白化时,有时一些特征值在数值上接近于0,这样在缩放步骤时我们除以将导致除以一个接近0的值,这可能使数据上溢 (赋为大数值)或造成数值不稳定。因而在实践中,我们使用少量的正则化实现这个缩放过程,即在取平方根和倒数之前给特征值加上一个很小的常数 :

当x在区间 [-1,1] 上时, 一般取值为


5. 参考:

UFLDL   Tutorial 

  • 14
    点赞
  • 69
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
白化滤波器是一种在信号处理和图像处理领域常用的滤波器。其作用是通过将输入信号的频谱进行变换,使得输出信号在所有频率上都具有相同的能量。这样可以去除输入信号中的颜色偏移,达到平衡频谱能量的效果。 在Matlab中,可以使用以下步骤来实现白化滤波器: 1. 首先,读取输入信号或图像,并将其转换为灰度图像(如果输入为彩色图像)。 2. 使用fft函数对输入信号进行傅里叶变换,得到频谱表示。 3. 计算频谱的功率谱密度(PSD),即将频谱每个点的幅度平方。 4. 对PSD进行归一化处理,即将PSD除以其平均值,使得频谱的能量值在不同频率上都接近相同。 5. 将归一化后的PSD应用于原始频谱,可以通过将原始频谱的每个点除以对应频率的归一化PSD的平方根来实现。 6. 使用ifft函数对白化后的频谱进行逆傅里叶变换,得到白化后的信号。 示例代码如下: ```matlab % 读取输入信号或图像 inputSignal = imread('input.jpg'); % 转换为灰度图像 grayImage = rgb2gray(inputSignal); % 对灰度图像进行傅里叶变换 fftImage = fft2(double(grayImage)); % 计算功率谱密度 psd = abs(fftshift(fftImage)).^2; % 归一化处理 normalizedPsd = psd / mean(psd(:)); % 应用归一化PSD到原始频谱 whiteSpectrum = fftImage ./ sqrt(normalizedPsd); % 对白化后的频谱进行逆傅里叶变换 whitenedImage = ifft2(ifftshift(whiteSpectrum)); % 显示白化后的图像 imshow(uint8(abs(whitenedImage))); ``` 上述代码中,通过读取输入图像,并进行灰度化处理,然后进行傅里叶变换得到频谱。接着计算功率谱密度,并进行归一化处理。最后将归一化PSD应用到原始频谱中,进行逆傅里叶变换得到白化后的信号。最后通过imshow函数显示白化后的图像。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值