DeepLearning (三) 预处理：主成分分析与白化

最新推荐文章于 2024-05-15 10:37:26 发布

Liu_LongPo

最新推荐文章于 2024-05-15 10:37:26 发布

阅读量1.1w

点赞数 9

分类专栏：计算机视觉 Machine Learning Deep Learning 文章标签： pca 机器学习深度学习

本文链接：https://blog.csdn.net/llp1992/article/details/45640527

版权

计算机视觉同时被 3 个专栏收录

28 篇文章 0 订阅

订阅专栏

Machine Learning

17 篇文章 1 订阅

订阅专栏

Deep Learning

8 篇文章 0 订阅

订阅专栏

【原创】Liu_LongPo 转载请注明出处
【CSDN】http://blog.csdn.net/llp1992

PCA算法前面在前面的博客中已经有介绍，这里简单在描述一下，更详细的PCA算法请参考我的博客：机器学习实战ByMatlab（二）PCA算法

PCA 的主要计算步骤

1.数据预处理，使得每一维数据都有相同的均值0
2.计算数据的协方差矩阵， $\Sigma=\frac {1}{m} \sum_{i=1}^{m}(x^{(i)})(x^{(i)})^T$
3.对协方差矩阵 $\Sigma$ 进行奇异值分解，得到特征值 $u$ 以及特征向量 $d$
4.旋转数据 $x_{rot} = U^Tx$
5.选择主成分的个数 $k$
6.数据降维 $x'^{(i)} = x_{rot,1-k}^{(i)}=u^T_{1-k}x^{(i)}$

PCA 的另外一种解释是： $x_{rot}$ 是一个 $n$ 维向量，其中前 $k$ 个成分可能比较大，而后几个成分可能比较小，PCA 算法做的其实就是丢弃 $x_{rot}$ 后面 $n-k$ 个较小的成分，即将这些成分的值近似为0，然后仅用这前 $k$ 个成分来定义 $k$ 维向量 $x'$

还原近似数据

当我们得到降维后的数据 $x'$ , 我们想还原原来的数据，只需要左乘 u 即可，即 $x = Ux_{rot}$

选择主成分的个数

关于PCA中主成分的个数 $k$ 的选择:

如果 $k$ 过大，则数据压缩率不高，在极限情况 $k=n$ 时，等于是使用原始数据；
如果 $k$ 过小，则数据的近似误差太大

我们通常考虑的是不同 $k$ 值可以保留的方差百分比，具体来说，如果 $k=n$ ,那么我们得到的是对数据的完美近似，也就是保留了100%的方差，即原始数据的所有变化都被保留下来；相反，如果 $k=0$ ,那等于是使用零向量来逼近输入数据，也就是只有0%的方差被保留下来。

一般而言，设 $\lambda_1 ,\lambda_2,...,\lambda_n$ 表示 $\Sigma$ 的特征值（由大到小排序，在matlab中可由 svd 函数得到），使得 $\lambda_j$ 为对应的特征向量 $u_j$ 的特征值，那么如果我们保留前 $k$ 个成分，则保留的方差百分比可计算为：

\sum k j = 1 λ j \sum n j = 1 λ j

$\frac {\sum_{j=1}^{k}\lambda_j}{\sum_{j=1}^{n}\lambda_j}$

以处理图像数据为例，一个惯常的经验法则是选择 $k$ 以保留99%的方差，换句话说，我们选取满足以下条件的最小 $k$ 值：

\sum k j = 1 λ j \sum n j = 1 λ j \geq 99 %

$\frac {\sum_{j=1}^{k}\lambda_j}{\sum_{j=1}^{n}\lambda_j} \geq 99\%$

对图像数据应用PCA算法

假设我们的特征为 $x_1,x_2,...,x_n$ ,对于非图像数据的处理，我们一般要计算每个特征 $x_j$ 的均值和方差，然后将其取值范围规整化为零均值和单位方差。不过对于大多数自然图像来说，由于其自身的平稳性，图像任一部分的统计性质都应该和其它部分相同，因此我们不用进行方差归一化。

所以对图像进行处理时，步骤如下：

1.求特征均值： $u^{(i)} := \frac {1}{n} \sum_{j=1}^{n}x_j^{(i)}$
2.零均值处理： $x_j^{(i)} := x_j^{(i)} - u_j^{(i)}$ for all $j$

白化

白化其实跟PCA算法还是挺相似的。举例来说，假设训练数据是图像，由于图像中相邻像素之间具有很强的相关性，所以用于训练时输入是冗余的。白化的目的就是降低输入的冗余性；更正式的说，我们希望通过白化过程使得学习算法的输入具有如下性质：

1.特征之间相关性较低
2.所有特征具有相同的方差(图像处理中我们一般设置为单位方差)

在PCA算法中，我们对数据进行降旋转 $x_{rot}^{(i)} = U^Tx^{(i)}$ 时，已经消除了输入特征 $x^{(i)}$ 之间的相关性,举个例子：假如我们的二维数据图形化如下：

显然这是一个二维数据分布，其中横轴 $x_1$ 跟竖轴 $x_2$ 之前呈现正相关关系，即 $x_2$ 随着 $x_1$ 的增大而增大，然后我们将其投影到特征向量上 $x_{rot}^{(i)} = U^Tx^{(i)}$ ，得到如下图：

此时 $x_2$ 已经不随着 $x_1$ 的增大而增大了，也就是说 $x_1$ 与 $x_2$ 消除了相关性。

特征单位方差处理

为了使每个输入特征具有单位方差，我们可以直接使用 $\frac {1}{\sqrt {\lambda_i}}$ 作为缩放因子来缩放每个特征 $x_{rot,i}$ ,具体地，我们定义白化后的数据如下：

x P C A w h i t e, i = x r o t , i λ i - - \sqrt

$x_{PCAwhite,i} = \frac {x_{rot,i}}{\sqrt {\lambda_i}}$

此时的 $x_{PCAwhite,i}$ 是数据经过PCA白化后的版本, 其不同的特征之间不相关并且具有单位方差。

ZCA 白化

假如 $R$ 是任意正交矩阵，即满足 $RR^T = R^TR = I$ ,那么 $Rx_{PCAwhite}$ 仍然具有单位协方差。在ZCA白化中，令 $R = U$ 。我们定义ZCA白化的结果为：

x Z C A w h i t e = U x P C A w h i t e

$x_{ZCAwhite} = Ux_{PCAwhite}$

正则化

实践中需要实现PCA白化或ZCA白化时，有时一些特征值 $\lambda_i$ 在数值上接近于0，这样在缩放步骤时我们除以 $\sqrt \lambda _i$ 将导致除以一个接近0的值；这可能使数据上溢 (赋为大数值)或造成数值不稳定。因而在实践中，我们使用少量的正则化实现这个缩放过程，即在取平方根和倒数之前给特征值加上一个很小的常数 $\epsilon$ :

x P C A w h i t e, i = x r o t , i λ i + ϵ - - - - - \sqrt

$x_{PCAwhite,i} = \frac{x_{rot,i}}{\sqrt{\lambda_i+\epsilon}}$

当 $x$ 在区间[-1,1]上时, 一般取值为 $\epsilon \approx 10^{-5}$
对图像来说, 这里加上 $\epsilon$ ，对输入图像也有一些平滑(或低通滤波)的作用。这样处理还能消除在图像的像素信息获取过程中产生的噪声，改善学习到的特征。

matlab 实例

1.图像加载 12x12 的patch，共10000个，转换为 144x10000的矩阵，即数据是144维

x = sampleIMAGESRAW();

随机显示200个图像块，如下图：

2.零均值化

meanVal = mean(x);
x = bsxfun(@minus,x,meanVal);

此时 $x$ 为零均值数据

3.求协方差矩阵，并对协方差矩阵进行奇异值分解，再对数据进行特征向量投影

xRot = zeros(size(x)); 
[u,d] = svd(x*x'/size(x,2)); 
xRot = u' * x;

4.PCA 检测，计算协方差矩阵

covar = zeros(size(x, 1)); 
covar = xRot*xRot'/size(xRot,2);

此时的协方差矩阵为144x144的矩阵，显示为图像如下：

对角线为数据的自相关，也就是方差，值最大，所以颜色最亮，两边为协方差，值比较小，故颜色较暗，这里为蓝色。

5. 寻找能够保留90%方差的最小 $k$ 值

k = 0; dVal = diag(d); % 列向量 sumDVal = sum(dVal); kP = 0; while kP<0.9 k = k+1; kP = sum(dVal(1:k)) / sumDVal; end

此时 $k$ 为43，当设置为保留 99% 的方差时， $k$ 为116.

6. PCA降维

xHat = zeros(size(x)); xHat = u(:,1:k) * xRot(1:k,:);

将 144维的数据降维到43维，并用43维数据还原图像如下：

7. PCA白化与规则化

epsilon = 0.1; xPCAWhite = zeros(size(x)); xPCAWhite = bsxfun(@rdivide,xRot,sqrt((dVal+epsilon)));

8. 检测PCA白化是否正确，计算协方差矩阵并显示

covar = xPCAWhite * xPCAWhite' / size(xPCAWhite,2);

白化后的协方差矩阵图像如下：

如果没有进行规则化，也就是我们将 $\epsilon$ 设置为0，此时白化后的协方差矩阵如下图：

9.ZCA白化

xZCAWhite = zeros(size(x)); xZCAWhite = u*xPCAWhite;

ZCA白化后图像如下：

确定要放弃本次机会？
福利倒计时
: :

立减 ¥
普通VIP年卡可用
立即使用

Liu_LongPo

关注关注

9
点赞

踩

22

收藏

觉得还不错? 一键收藏

3
评论

DeepLearning (三) 预处理：主成分分析与白化

【原创】Liu_LongPo 转载请注明出处【CSDN】http://blog.csdn.net/llp1992PCA算法前面在前面的博客中已经有介绍，这里简单在描述一下，更详细的PCA算法请参考我的博客：机器学习实战ByMatlab（二）PCA算法 PCA 的主要计算步骤 1.数据预处理，使得每一维数据都有相同的均值0 2.计算数据的协方差矩阵，Σ=1m∑mi=1(x(i))(x(
复制链接

扫一扫

专栏目录

主成分分析与白化预处理

程引的专栏

08-11 2851

上一节介绍了主成分分析应用于2维数据。现在使用高维的图像数据来试试效果。原始图像如图1所示。图1 每个图片都是12*12的小patch，原始数据是一个144*10000的矩阵x。在使用了PCA旋转之后，可以检查一下此时的协方差矩阵是否已经成功变成对角阵了，如图2所示。 avg=mean(x,1); x=x-repmat(avg,size(x,1),1); xRot = ze

深度学习笔记之主成分分析

07-13 1606

我们通过一个有损压缩的例子来介绍主成分分析（Principal components analysis, PCA）。 Example 假设我们有mmm个数据点{x(1),⋯,x(m)}{x(1),⋯,x(m)}\left\{{\boldsymbol{x}^{(1)},\cdots,\boldsymbol{x}^{(m)}}\right\}，其中数据维度为x(1)∈Rnx(1)∈Rn\bolds...

3 条评论您还未登录，请先登录后发表或查看评论

实现主成分分析和白化

周红伟讲AI

09-04 507

实现主成分分析和白化 From Ufldl Jump to: navigation, search 在这一节里，我们将总结PCA, PCA白化和ZCA白化算法，并描述如何使用高效的线性代数库来实现它们。首先，我们需要确保数据的均值（近似）为零。对于自然图像，我们通过减去每个图像块(patch)的均值（近似地）来达到这一目标。为此，我们计算每个图像块的均值，并从每

深度学习之基于Matlab主成分(PCA)分析和BP神经网络的人脸识别系统

最新发布

Q1744828575的博客

05-15 519

一、项目背景随着人工智能和深度学习的快速发展，人脸识别技术已经广泛应用于安全监控、身份验证、人机交互等多个领域。然而，传统的人脸识别方法在面对光照变化、姿态变化、表情变化等复杂环境时，识别精度和稳定性往往不尽如人意。因此，开发一种基于深度学习的高效、准确的人脸识别系统具有重要的研究意义和应用价值。二、项目目标本项目旨在利用Matlab平台和主成分（PCA）分析与BP神经网络相结合的方法，开发一个高效、准确的人脸识别系统。

预处理: 主成分分析和白化

Allenlzcoder的博客

01-03 388

预处理: 主成分分析和白化本博客转载自：http://blog.csdn.net/itplus/article/details/11451327

机器学习的数据预处理模块（二）：主成分分析

05-10

机器学习的数据预处理模块（二）：主成分分析

利用c++实现：主成分分析算法代码

09-07

主成分分析（Principal Component Analysis，PCA）是一种统计学方法，用于将高维数据转换为一组线性不相关的变量，称为主成分。这些主成分是原始数据集中的最大方差方向，使得数据在新坐标系下的投影能保留尽可能多...

pcanishi:主成分分析

06-09

**主成分分析(PCA)详解** 主成分分析（PCA，Principal Component Analysis）是一种常见的数据分析方法，主要用于降低数据的维度，同时保持数据集中的方差最大化。这种方法在许多领域都有广泛的应用，如机器学习、...

deeplearning4j:deeplearning4j注意

04-29

- **Spark集成**：Deeplearning4j与Apache Spark无缝集成，支持在大规模数据集上进行分布式训练。 - **Horovod**：可以利用Horovod库进行多GPU和分布式训练，提高训练效率。 4. **库和工具** - **ND4J**：Deep...

svd算法matlab代码-pca:主成分分析

05-27

PCA（主成分分析，Principal Component Analysis）是一种常用的数据降维技术，它通过线性变换将原始数据转换到一个新的坐标系中，新坐标系中的各坐标轴是原数据集中变量的线性组合，这些坐标轴按照解释数据方差的...

数据白化处理matlab代码

06-02

数据白化处理matlab代码数据白化处理matlab代码数据白化处理matlab代码

深度学习入门教学——主成分分析PCA

计算机硕士的博客

09-04 633

深度学习入门教学——主成分分析

主成分分析

XB_please的博客

09-03 778

目录： 1.什么是PCA？ 2.PCA的作用？ 3.PCA步骤？ 1.什么是PCA？ PCA（principal components analysis）即主成分分析技术，又称主分量分析。主成分分析也称主分量分析，旨在利用降维的思想，把多指标转化为少数几个综合指标。在统计学中，主成分分析PCA是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中，使得任何数据投影的第一...

【math系列】《深度学习》中主成分分析（PCA）的一个知识点证明

qq_36561680的博客

05-24 258

【线性代数】PCA中的数学证明题

数据预处理----白化(Whitening)

zzylalalala的博客

12-01 1709

我对【零相位】的理解就是，相对于原来的空间（坐标系），白化后的数据并没有发生旋转（坐标变换）。ZCA白化则是在PCA白化基础上，将PCA白化后的数据旋转回到原来的特征空间，这样可以使得变换后的数据更加接近原始输入数据。那么我们要怎样旋转才能得到不想关的数据呢，实际上，在协方差矩阵中，其特征向量指示的就是数据扩散的最大方向。当特征多项式等于0的时候，称为A的特征方程，特征方程是一个齐次线性方程组，求解特征值的过程其实就是求解特征方程的解。即原始数据存在一定的相关性，我们想要旋转数据以使得数据不在存在相关性。

【理论知识学习33】深度学习机器学习中的白化 VS PCA

呆呆象呆呆的博客

04-27 1825

DL四（预处理：主成分分析与白化 Preprocessing PCA and Whitening ） - robert_ai - 博客园 深度学习之8——数据预处理 - 知乎 深度学习中的白化预处理_Sirius_0的博客-CSDN博客白化（Whitening）：PCA vs. ZCA - Lee的白板报的个人空间 - OSCHINA - 中文开源技术交流社区白化（预处理步骤）【转】 - osc_f1tgjw6d的个人空间 - OSCHINA - 中文开源技术交流社区 [转载]什么是白化(whiteni

数据预处理的几个方法：白化、去均值、归一化、PCA

GZKPeng的博客

12-01 3万+

以上转载自：http://ufldl.stanford.edu/wiki/index.php/%E7%99%BD%E5%8C%96 假定数据表示成矩阵为X，其中我们假定X是[N*D]维矩阵(N是样本数据量，D为单张图片的数据向量长度)。去均值，这是最常见的图片数据预处理，简单说来，它做的事情就是，对待训练的每一张图片的特征，都减去全部训练集图片的特征均值，这么做的直观意义就是，我们把输入数据

机器学习（七）白化whitening

热门推荐

hjimce的专栏

03-12 6万+

输入数据集X，经过白化处理后，新的数据X'满足两个性质： (1)特征之间相关性较低； (2)所有特征具有相同的方差。其实我们之前学的PCA算法中，可能PCA给我们的印象是一般用于降维操作。然而其实PCA如果不降维，而是仅仅使用PCA求出特征向量，然后把数据X映射到新的特征空间，这样的一个映射过程，其实就是满足了我们白化的第一个性质：除去特征之间的相关性。因此白化算法的实现过程，第一步操作就是PCA，求出新特征空间中X的新坐标，然后再对新的坐标进行方差归一化

数据预处理课件

06-14

数据预处理是数据分析和机器学习流程中的关键步骤，它旨在提升数据质量和可用性，以便更准确地进行后续模型构建和洞察发现。在本课程的课件中，主要讨论了以下几个核心部分： 1. **数据预处理的目的**： - 数据...

“相关推荐”对你有帮助么？

非常没帮助

没帮助

一般

有帮助

非常有帮助

提交