UFLDL教程答案(3):Exercise:PCA_in_2D&PCA_and_Whitening

最新推荐文章于 2020-03-25 15:05:15 发布

VIP文章 slim1017

最新推荐文章于 2020-03-25 15:05:15 发布

阅读量2.3k

点赞数 2

分类专栏： UFLDL教程答案深度学习文章标签： UFLDL教程答案 andrew ng 深度学习 ExercisePCA_in_2D PCA_and_Whitening

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012816943/article/details/50274805

版权

教程地址：http://deeplearning.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B

练习地址1：http://deeplearning.stanford.edu/wiki/index.php/Exercise:PCA_in_2D

练习地址2： http://deeplearning.stanford.edu/wiki/index.php/Exercise:PCA_and_Whitening

1.习惯性啰嗦几句

（1）通过svd来避免求高维度数据的协方差矩阵

PCA的推导有挺多版本的，ng的CS229中PCA那章讲过，还介绍了通过svd来避免求高维度数据的协方差矩阵(高维度协方差矩阵计算量很大)，所以这次PCA_in_2D练习中我写了两个版本：

一个是pca_2d.m是按教程写的标准答案（但是我觉得教程绕了几个弯子,也可能是另有深意，我没理解到）。

一个是another_pca_2d.m，这是我按照我自己的理解，使用svd绕开求协方差矩阵这一步来计算pca：

建议先看看矩阵分析课本上关于奇异值分解(svd)的推导过程。

首先说说[u,s,v]=svd(x),s对角线上为x的奇异值，也是矩阵xx'特征值的平方根；u为矩阵xx'的特征向量。我们用Sigma代表数据x的协方差矩阵。

若X为n*m矩阵，n维特征，m个样本。m表示样本数，(xx'）/m其实就是Sigma(实际上应该是Sigma的样本估计，样本多就可认为就是Sigma)，也就是说可以直接通过s求得Sigma的特征值（把s对角线元素平方再除以m即可），这样计算，过程中并没有算Sigma具体是多少。

此外，PCA得出的最佳投影方向为Sigma的特征向量方向，xx'与(xx'）/m特征向量一样，所以u就是旋转矩阵。

而在教程中，有代码：

sigma = x * x' / size(x, 2)
[U,S,V] = svd(sigma);

U为sigma*sigma’的特征向量矩阵，S对角线为sigma的奇异值(也等于sigma*sigma‘的特征值开平方根)。

注意：先计算了协方差矩阵sigma，再用svd计算sigma的奇异值(S的对角线元素)，sigma奇异值就等于sigma的特征值。理由：根据矩阵分析中svd的推导过程，会先计算sigma*sigma‘的特征值，再开平方根，就得到了S(的对角线元素)；而由于sigma是实对称矩阵，sigma=sigma’，其实求得是sigma^2的特征值，再开根，其实就是sigma的特征值。此外，根据svd推导过程，U为sigma*sigma‘（也就是sigma^2）的特征向量组成的矩阵，那U同时也是sigma的特征向量矩阵，所以u和U中各向量其实是一样的（符号可能相反）。（矩阵A与A^2的特征向量都相同，特征值后者是前者的平方）。

综上：教程中使用svd是为了求sigma的特征值和特征向量(用eig函数也可以，只是svd数值计算上更稳定)，而实际上，根据CS229-PCA那章，svd可以直接绕过求sigma这步&#

最低0.47元/天解锁文章

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
4
评论
UFLDL教程答案(3):Exercise:PCA_in_2D&PCA_and_Whitening

数据预处理：PCA及白化。
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。