用较少的变量去解释原来资料中的大部分变异,将相关性很高的变量转化成彼此相互独立或不相关的变量。通常是选出比原始变量个数少,能解释大部分资料中的变异的几个新变量,即所谓主成分,并用以解释资料的综合性指标。
主成分分析法的过程,它是一个构造转换矩阵的过程。
a.对变量矩阵X进行均值归零处理
b.求协方差矩阵M = X’X/m(m是X的行数,也就是有多少个变量)
c.求出协方差矩阵的特征值和特征向量,特征向量组成的矩阵就是变换矩阵
d.将特征向量按照特征值大小进行排序,组成矩阵p
e.Y = XP得到最后的变换的数据