思想:利用降维的思想将多指标或多因素转化为少数几个综合指标。
这几个综合指标应该互不影响,即具有正交性,而原来的指标具有相互联系性。
这几个综合指标成为主成分。主成分变量一般不超过5到6个,包含原始变量信息的80%以上。
[pc,score,var,t2]=princomp(X)
(1)pc为主分量Z的系数,也叫因子系数
(2)score为主分量的得分值,得分矩阵与数据矩阵x的阶数矩阵一致。
(3)var为对应矩阵score对应列的方差向量,即相关系数的R的特征值;
(4)t2 表示的t2-统计量(主要用于方差分析)
主成分分析法可以得出在某些因素中哪些因素的权重比较大,哪些因素比较重要等。
关于主成分的实际意义要结合具体问题和有关专业知识才能给出合理的解释。虽然利用主成分本身可对所研究的问题在一定程度上作分析,但主成分分析本身往往并不是最终目的,更重要的是利用主成分综合原始变量的信息,达到降维的目的,然后对数据作进一步的分析,如回归分析、聚类分析、判别分析等。