PCA算法的三种求解形式对比

最新推荐文章于 2021-12-18 21:40:28 发布

「已注销」

最新推荐文章于 2021-12-18 21:40:28 发布

阅读量2.1k

点赞数 1

文章标签： PCA 特征分解 SVD分解

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/jason_downey/article/details/83042311

版权

这篇博客探讨了PCA算法的三种求解方式：直接通过SVD，计算协方差矩阵后的特征分解，以及SVD分解。文章首先介绍了随机变量的数字特征和统计量，然后讲解了特征分解、SVD分解的概念。最后，作者对比了实对称矩阵的特征分解和SVD，指出在PCA中，实对称矩阵的特征分解和SVD结果相同，而第三种方法（通过协方差矩阵的SVD）是最常见的PCA求解方式。

摘要由CSDN通过智能技术生成

PCA算法的三种求解形式对比

均值和方差
- 随机变量的数字特征
- 数理统计中常用统计量
特征分解
SVD分解
对实对称矩阵的单独讨论
PCA三种求解形式对比

前段时间回顾PCA算法时，发现存在三种不同的求解形式。一种是直接通过求解中心化后的样本数据 $X_{center}$ 的SVD分解得到映射向量；一种是先求出 $X_{center}$ 的协方差矩阵 $C$ ，然后计算对称矩阵 $C$ 的特征分解，最后得到映射向量；最后一种（也是常用的一种）也是先求出 $X_{center}$ 的协方差矩阵 $C$ ，然后计算对称矩阵 $C$ 的SVD分解，最后得到映射向量。当时很困惑到底应该用哪种，哪种是最正确的做法，因此对相关的知识点进行了梳理，也就有了这篇笔记。

根据牵涉到的知识点，这篇笔记将先介绍随机变量的数字特征（期望、方差等）以及数理统计中常用的统计量（样本均值、样本方差），接着介绍特征值、特征向量和特征分解，然后介绍SVD分解，最后分析PCA的三种求解形式之间的关系。

均值和方差

随机变量的数字特征

设 $X, Y$ 都是一维随机变量。
数学期望： $E [X]$

方差： $D[X]=Var[X]=E[(X-E[X])^2]=E[X^2]-(E[X])^2$

协方差： $C o v (X, Y) = E [(X - E [X]) (Y - E [Y])] = E [X Y] - E [X] E [Y]$ . 反应 $X$ 与 $Y$ 相互间关系。

相关系数： $\rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D[X]\cdot \sqrt{D[Y]}}}$

协方差矩阵（对称阵）：
$\left[ \begin{matrix} Cov(X,X) & Cov(X,Y) \\ Cov(Y,X) & Cov(Y,X) \\ \end{matrix} \right]$

数理统计中常用统计量

设 $X_i, Y_i$ 都是一维数据，即 $X_i$ 只有一个特征。
样本均值： $\overline{X}=\frac{1}{N}\sum_{i=1}^{N}X_i$

样本方差： $S^2=\frac{1}{N-1}\sum_{i=1}^{N}(X_i-\overline{X})^2$

协方差： $Cov(X,Y)=\frac{1}{N-1}\sum_{i=1}^{N}(X_i-\overline{X})(Y_i-\overline{Y})$
协方差矩阵的计算类似。

上述公式也是机器学习中计算 $\mu,\sigma^2$ 的基本公式。

对多维样本（样本具有多个特征），令 $X$ 为包含 $m$ 个 $n$ 维样本 $x^{(i)}$ 的样本集。则：

最低0.47元/天解锁文章

「已注销」

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

「已注销」 CSDN认证博客专家 CSDN认证企业博客

码龄7年

2: 原创

-: 周排名

-: 总排名

2470: 访问

: 等级

47: 积分

1: 粉丝

1: 获赞

1: 评论

2: 收藏

私信

关注

热门文章

最新评论

PCA算法的三种求解形式对比
穆幕: 深度好文！解惑了

最新文章

BP Algorithm for CNN

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。