主成分分析（PCA）——以2维图像为例

最新推荐文章于 2024-07-08 11:30:28 发布

AI周红伟

最新推荐文章于 2024-07-08 11:30:28 发布

阅读量1w

点赞数 1

分类专栏：大数据文章标签：深度学习

大数据专栏收录该内容

651 篇文章 8 订阅

订阅专栏

主成分分析（PCA）——以2维图像为例

分类： UFLDL 2014-08-11 15:20 913人阅读评论(0) 收藏举报

深度学习模式识别 Deep Learning UFLDL 压缩

这一节不论是思想还是实现都比较容易。

主成分分析（PCA）就是模式识别里面说的K-L变换，思想是完全相同的。

详情可见我的博文：特征选择（三）-K-L变换

这里简单介绍几个概念。顺便贴出代码和效果图。

[cpp] view plain copy print ?

<span style="font-family:Times New Roman;font-size:14px;">xRot = zeros(size(x));
xRot=u'*x;
figure(2);
scatter(xRot(1, :), xRot(2, :));
title('xRot');</span>

<span style="font-family:Times New Roman;font-size:14px;">xRot = zeros(size(x));
xRot=u'*x;
figure(2);
scatter(xRot(1, :), xRot(2, :));
title('xRot');</span>

得到原始图和主轴方向，如图1所示。

图1

PCA变换

就是要找到数据分布最大的方向，作为主轴方向，然后以这些主轴方向为基，旋转过去，就完成了数据的去相关性，这是因为此时数据的协方差矩阵成了对角阵。如图2所示。

[cpp] view plain copy print ?

xRot = zeros(size(x));
xRot=u'*x;
figure(2);
scatter(xRot(1, :), xRot(2, :));
title('xRot');

xRot = zeros(size(x)); 
xRot=u'*x;
figure(2);
scatter(xRot(1, :), xRot(2, :));
title('xRot');

图2

PCA降维

如果我们只取了特征根最大的几个特征向量作为旋转矩阵，那么这就是PCA降维。如图3。

[cpp] view plain copy print ?

<span style="font-family:Times New Roman;font-size:14px;">k = 1;
xHat = zeros(size(x));
xHat=u(:,1:k)*u(:,1:k)'*x;
figure(3);
scatter(xHat(1, :), xHat(2, :));
title('xHat');</span>

<span style="font-family:Times New Roman;font-size:14px;">k = 1; 
xHat = zeros(size(x));
xHat=u(:,1:k)*u(:,1:k)'*x;
figure(3);
scatter(xHat(1, :), xHat(2, :));
title('xHat');</span>

图3

PCA白化

我们不降维，而此基础上将数据左乘一个 $diag\left( {{1\mathord{\left/ {\vphantom {1 {\sqrt {{\lambda _i}} }}} \right.\kern-\nulldelimiterspace} {\sqrt {{\lambda _i}} }}} \right)$ ，那么数据就按照各自主轴方向进行压缩拉伸，成了一个球形，这就是PCA白化。

[cpp] view plain copy print ?

epsilon = 1e-5;
xPCAWhite = zeros(size(x));
xPCAWhite=diag(1./(diag(s)+epsilon))*u'*x;
figure(4);
scatter(xPCAWhite(1, :), xPCAWhite(2, :));
title('xPCAWhite');

epsilon = 1e-5;
xPCAWhite = zeros(size(x));
xPCAWhite=diag(1./(diag(s)+epsilon))*u'*x;
figure(4);
scatter(xPCAWhite(1, :), xPCAWhite(2, :));
title('xPCAWhite');

这里加了一个epsilon是因为有的特征根已经很小了，归一化的时候根号了一下，容易出现数据上溢。同时它还有消除噪声的作用。如图4。

图4

ZCA白化

我们在PCA白化的基础上，左乘一个特征向量矩阵，数据的方向就会又转回去了。这就是ZCA白化，ZCA白化去除了数据的相关性、保留了最大限度原始数据的形式。是数据预处理的好方法。如图5。

[cpp] view plain copy print ?

xZCAWhite = zeros(size(x));
xZCAWhite=u*diag(1./(diag(s)+epsilon))*u'*x;
figure(5);
scatter(xZCAWhite(1, :), xZCAWhite(2, :));
title('xZCAWhite');

xZCAWhite = zeros(size(x)); 
xZCAWhite=u*diag(1./(diag(s)+epsilon))*u'*x;
figure(5);
scatter(xZCAWhite(1, :), xZCAWhite(2, :));
title('xZCAWhite');

图5

AI周红伟

关注

1
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录