SAS常用基础代码例子-主成分分析
给出1991年我国30个省、区、市城镇居民的月平均消费数据,所考察的八个指标如下(单位均为元/人)
X1:人均粮食支出; X2:人均副食支出;X3 :人均烟酒茶支出;X4 :人均其他副食支出;
X5 :人均衣着商品支出;X6 :人均日用品支出;X7 :人均燃料支出; X8:人均非商品支出;
(1)求样本相关系数矩阵R;
(2)从R出发做主成分分析,求各主成分的贡献率及前两个主成分的累计贡献率;
(3)求出前两个主成分并解释其意义,按第一主成分得分将30个省、区、市排序,结果如何?
解:建立数据集shuju,运用sas的proc corr过程求得八个变量的观测数据的样本协方差矩阵S:
proc corr cov nosimple data=shuju;
var x1-x8;
run;
proc princomp data=shuju out=bb;
var x1-x8;
run;
协方差矩阵(Covariance Matrix)S为:
由此看出,各指标的样本方差差异很大,因此从样本相关系数矩阵出发做主成分分析(即求标准化指标的样本成分)。
由