1.判断是否适合做主成份分析,变量标准化
Kaiser-Meyer-Olkin抽样充分性测度也是用于测量变量之间相关关系的强弱的重要指标,是通过比较两个变量的相关系数与偏相关系数得到的。
KMO介于0于1之间。KMO越高,表明变量的共性越强。如果偏相关系数相对于相关系数比较高,则KMO比较低,主成分分析不能起到很好的数据约化效果。
根据Kaiser(1974),一般的判断标准如下:
0.00-0.49,不能接受(unacceptable);
0.50-0.59,非常差(miserable);
0.60-0.69,勉强接受(mediocre);
0.70-0.79,可以接受(middling);
0.80-0.89,比较好(meritorious);
0.90-1.00,非常好(marvelous)。
SMC即一个变量与其他所有变量的复相关系数的平方,也就是复回归方程的可决系数。
SMC比较高表明变量的线性关系越强,共性越强,主成分分析就越合适。
. estat smc
. estat kmo
. estat anti//暂时不知道这个有什么用
得到结果,说明变量之间有较强的相关性,适合做主成份分析。
Squared multiple correlations of variables with all other variables ----------------------- Variable | smc -------------+--------- x1 | 0.8923 x2 | 0.9862 y1 | 0.9657 y2 | 0.9897 y3 | 0.9910 y4 | 0.9898 y5 | 0.9769 y6 | 0.9859 y7 | 0.9735 -----------------------
变量标准化
. egen z1=std(x1)
2.对变量进行主成份分析