而B中每一列的模长为 Avi 由于 vi 是 ATA 的特征向量,对应的特征值为 λi
网站中有这句话,但是没有详细的推导
以下给出
由于
A=BVT→AV=B→[Av1,Av2,...,Avn]=B
所以B中每一列的模长为 |Avi|
由于上文中
ATA=VDVT→ATAV=VD
而且有 D=diagλ1,λ2,...,λn
所以
ATAV=VD=[v1,v2,...,vn]D=[v1λ1,v2λ2,...,vnλn]
而且
ATAV=ATA[v1,v2,...,vn]
由此得 vi 是 ATA 的特征向量
这在 奇异值分解(SVD)原理详解及推导 同样有用到
奇异值分解(SVD)原理详解及推导
从PCA和SVD的关系拾遗
wikipedia-奇异值分解
奇异值分解(SVD)的之低秩近似和特征降维
阅读顺序:
PCA的数学原理,奇异值分解(SVD)原理详解及推导(穿插)理解PCA和SVD ,从PCA和SVD的关系拾遗,奇异值分解(SVD)的之低秩近似和特征降维
现在谈一下SVD在降维中两种常用的应用
- 一种是利用PCA,
XTX=UΣVT
,
Y=XUreduce
,其中
Y
即为把
X 降维后的量(特征向量减少,空间维度降低) - 另一种是奇异值分解(SVD)的之低秩近似和特征降维中的第二个作用,直接对X降维,表现为只利用一部分的奇异值,让矩阵由秩r变为秩k(r≥k)