最近刚刚学习了因子分析的方法,今天来利用《多元统计分析》书中所给的例子与数据,对这个方法进行练习。
中心城市的综合发展是带动周边地区经济发展的重要动力。在我国经济发展进程中,各个中心城市一直是该地区经济和社会发展的“引路者”。因而,分析评价全国35个中心城市的综合发展水平,无论是对城市自身的发展,还是对周边地区的进步,都具有十分重要的意义。因而,本文应用因子分析作出评价。
因子分析法是研究相关矩阵内部的依存关系,寻找出支配多个指标(可观测)相互关系的少数几个公共的因子(不可观测)以再现原指标与公因子之间的相关关系的一种统计方法。这些公因子是彼此独立或不相关的,又往往是不能够直接观测的。在所研究的问题中,以公因子(新变量)代替原指标(原变量)作为研究对象,并要求不损失或很少损失原指标所包含的信息,用公因子代替原指标所作的分析会比较简单和清楚。通常,这种方法需要求出因子结构和因子得分模型。前者通过相关系数来反映原指标与公因子之间的相关关系,后者是以回归方程的形式将指标表示为因子的线性组合。具体步骤如下:
1)对原始数据进行标准化变换,求出各指标间的相关系数矩阵;
2)建立因子模型,并确定因子贡献率及累计贡献率;
3)对因子载荷矩阵进行变换和旋转,并计算因子得分。
对于由因子模型矩阵得到的初始因子载荷矩阵,如果因子载荷之间相差不大,对因子的解释就不是很明确,因此要通过旋转因子坐标轴,使每个因子载荷在新坐标系中能按列和行向0或1两极分化。一般采取方差最大正交旋转法就能得到明确的分析结果。
接下来是具体的操作与分析。
一、指标解释
选取反映城市综合发展水平的11个指标,其中7个社会指标,分别为:x1——非农业人口数(万人);x2——工业总产值(万元);;x3——批发零住宿餐饮业从业人数(万人);x4——地方政府预算内收入(万元);x5——城乡居民年底储蓄余额(万元);x6——在岗职工人数(万人);x7——在岗职工工资总额(万元)。
4个城市公共设施水平的指标,分别为:x