主成分分析法简介
主成分分析(Principal Component Analysis,PCA),将多个变量通过线性变换以选出较少个数重要变量的一种多元统计分析方法。
主成分:有原始指标综合形成的几个新指标。依据主成分所含信息量的大小成为第一主成分,第二主成分等等。
主成分与原始变量之间的关系:
(1)主成分保留了原始变量绝大多数信息。
(2)主成分的个数大大少于原始变量的数目。
(3)各个主成分之间互不相关。
(4)每个主成分都是原始变量的线性组合。
操作实例
在spss中导入数据,选中分析->降维->因子…
把数据全部导入右边,描述选中系数,提取选中碎石图,得分选中因子得分矩阵。
方法一:
得到主成分中每个指标中的系数
在spss中归一化,得到Zx1,zx2…,也是选中分析->描述统计->描述;选中将标准化值另存为变量。就得到归一化的值,然后用exel中得到的系数与归一化值相乘累加得到F1,F2…最得到F =(成分1占的比率/选取的成分总比率)/F1 + (成分2占的比率/选取的成分总比率)/F2 +……
方法二:
此处唯一改变了系数,此处的系数直接就是成分得分系数矩阵的值,不像方法一中需要对方差特征值进行开平方。