PCA训练的一般方法步骤从应用的角度实现降维:
1.那原始数据的每一个样本用一个向量表示,然后所有的样本组合起来就构成了一个矩阵,为了避免样本收到单位的影响,样本需要标准化。
2.求该矩阵的协方差矩阵。所谓协方差就是cov(X,Y)比较向量X Y的相关性,有正相关和负相关,0表示不相关。cov=sum[(Xi-mean(X))*(Yi-mean(Y))]/(n-1)
若X=Y,cov为方差。
3.求协方差矩阵的特征值和特征向量,特征值和特征向量 :AX=λX,于是有:( A-λE)X=0;有解得条件是: A-λE|=0 ~~λ是方阵A的特征值,X是A的特征向量
4.讲求得的特征向量按照特征值的大小进行组合成一个映射矩阵(当我们取到矩阵的前N个最大的特征值的时候,我们可以说提取到的矩阵主要的成分),并根据指定PCA保留的特征个数取映射矩阵的前n行(列),作为最终映射矩阵。 5.用最终的映射矩阵对原始数据进行映射,达到降维目的
-------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- -------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- ------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------- PCA:是无监督学习,LAD有监督学习,未完待续~~~~