基本原理:方差最大原理
通过正交变换将原相关性变量转化为不相关的变量
第一主成分:线性组合 方差最大
第二主成分:线性组合,COV(F1,F2)=0
步骤:
原始数据标准化:DataAdjust(m*n)【m个样本,n个变量】
计算样本的协方差矩阵【cov=(n*n)】
计算协方差矩阵的特征值和特征向量
确定主成分:将特征值从大到小排序,计算贡献率,取累计贡献率大于85%即可,确定主成分个数k,选取k个特征向量组成矩阵EigenVectors(n*k)。
样本点投影到特征向量上:Y(m*k)=EigenVectors(n*k)*DataAdjust(m*n)