主成分分析 基本思想:
实质上是将多个指标综合成少数几个指标的方法。
主成分分析是利用降维的方法,在确保数据信息损失最小的原则下,把多个指标转化为少数几个综合指标的一种对多变量数据进行最佳综合简化的多元统计方法。
主成分是原始变量之间的线性组合,且主成分之间互不相关。
主成份分析的主要目的是压缩指标个数、简化数据,但常常与回归分析、因子分析、聚类分析、判别分析等等套用。
基本步骤 计算相关系数阵,检验待分析的变量是否适合做主成份分析。 根据所研究问题的初始变量的特征判断由协方差阵求主成分,还是由相关阵求主成分。
一般来说,分析中选择的变量具有不同的计量单位,或变量水平差异较大时,应选择基于相关系数矩阵的主成分分析。否则还是选择协方差阵做主成份分析效果更好。(实际情况可以都尝试一下~) 求协方差阵或相关系数阵的特征根及对应标准化特征向量。 确定主成分个数。 写出主成分的表达式。 SPSS应用
步骤:分析->降维->因子分析,选入变量后单击描述,如图:
因子分析及描述对话框
单击抽取后选择“碎石图”,保持默认的相关系数阵不变,如图:
抽取对话框
单击得分中的“显示因子得分系数矩阵”,如图:
得分对话框
输出的主要结果: