PCA算法的三种求解形式对比

这篇博客探讨了PCA算法的三种求解方式:直接通过SVD,计算协方差矩阵后的特征分解,以及SVD分解。文章首先介绍了随机变量的数字特征和统计量,然后讲解了特征分解、SVD分解的概念。最后,作者对比了实对称矩阵的特征分解和SVD,指出在PCA中,实对称矩阵的特征分解和SVD结果相同,而第三种方法(通过协方差矩阵的SVD)是最常见的PCA求解方式。
摘要由CSDN通过智能技术生成

前段时间回顾PCA算法时,发现存在三种不同的求解形式。一种是直接通过求解中心化后的样本数据 X c e n t e r X_{center} XcenterSVD分解得到映射向量;一种是先求出 X c e n t e r X_{center} Xcenter的协方差矩阵 C C C,然后计算对称矩阵 C C C特征分解,最后得到映射向量;最后一种(也是常用的一种)也是先求出 X c e n t e r X_{center} Xcenter的协方差矩阵 C C C,然后计算对称矩阵 C C CSVD分解,最后得到映射向量。当时很困惑到底应该用哪种,哪种是最正确的做法,因此对相关的知识点进行了梳理,也就有了这篇笔记。

根据牵涉到的知识点,这篇笔记将先介绍随机变量的数字特征(期望、方差等)以及数理统计中常用的统计量(样本均值、样本方差),接着介绍特征值、特征向量和特征分解,然后介绍SVD分解,最后分析PCA的三种求解形式之间的关系。

均值和方差

随机变量的数字特征

X , Y X,Y X,Y都是一维随机变量。
数学期望: E [ X ] E[X] E[X]

方差: D [ X ] = V a r [ X ] = E [ ( X − E [ X ] ) 2 ] = E [ X 2 ] − ( E [ X ] ) 2 D[X]=Var[X]=E[(X-E[X])^2]=E[X^2]-(E[X])^2 D[X]=Var[X]=E[(XE[X])2]=E[X2](E[X])2

协方差: C o v ( X , Y ) = E [ ( X − E [ X ] ) ( Y − E [ Y ] ) ] = E [ X Y ] − E [ X ] E [ Y ] Cov(X,Y)=E[(X-E[X])(Y-E[Y])]=E[XY]-E[X]E[Y] Cov(X,Y)=E[(XE[X])(YE[Y])]=E[XY]E[X]E[Y]. 反应 X X X Y Y Y相互间关系。

相关系数: ρ X Y = C o v ( X , Y ) D [ X ] ⋅ D [ Y ] \rho_{XY}=\frac{Cov(X,Y)}{\sqrt{D[X]\cdot \sqrt{D[Y]}}} ρXY=D[X]D[Y] Cov(X,Y)

协方差矩阵(对称阵):
C = [ C o v ( X , X ) C o v ( X , Y ) C o v ( Y , X ) C o v ( Y , X ) ] C= \left[ \begin{matrix} Cov(X,X) & Cov(X,Y) \\ Cov(Y,X) & Cov(Y,X) \\ \end{matrix} \right] C=[Cov(X,X)Cov(Y,X)Cov(X,Y)Cov(Y,X)]

数理统计中常用统计量

X i , Y i X_i, Y_i Xi,Yi都是一维数据,即 X i X_i Xi只有一个特征。
样本均值: X ‾ = 1 N ∑ i = 1 N X i \overline{X}=\frac{1}{N}\sum_{i=1}^{N}X_i X=N1i=1NXi

样本方差: S 2 = 1 N − 1 ∑ i = 1 N ( X i − X ‾ ) 2 S^2=\frac{1}{N-1}\sum_{i=1}^{N}(X_i-\overline{X})^2 S2=N11i=1N(XiX)2

协方差: C o v ( X , Y ) = 1 N − 1 ∑ i = 1 N ( X i − X ‾ ) ( Y i − Y ‾ ) Cov(X,Y)=\frac{1}{N-1}\sum_{i=1}^{N}(X_i-\overline{X})(Y_i-\overline{Y}) Cov(X,Y)=N11i=1N(XiX)(YiY)
协方差矩阵的计算类似。

上述公式也是机器学习中计算 μ , σ 2 \mu,\sigma^2 μ,σ2的基本公式。

对多维样本(样本具有多个特征),令 X X X为包含 m m m n n n维样本 x ( i ) x^{(i)} x(i)的样本集。则:
X = [ x ( 1 ) T x ( 2 ) T ⋮ x ( m ) T ] = [

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值