格式
专业资料整理
主成分分析计算方法和步骤:
在对某一事物或现象进行实证研究时
,
为了充分反映被研究对象个体之间的差异
,
研究者往往要考虑增加测量指标
,
这样就会增加研究问题的负载程度。但由于各
指标都是对同一问题的反映
,
会造成信息的重叠
,
引起变量之间的共线性
,
因此
,
在多指标的数据分析中
,
如何压缩指标个数、压缩后的指标能否充分反映个体
之间的差异
,
成为研究者关心的问题。而主成分分析法可以很好地解决这一问
题。
主成分分析的应用目的可以简单地归结为
:
数据的压缩、数据的解释。它常被
用来寻找和判断某种事物或现象的综合指标
,
并且对综合指标所包含的信息给
予适当的解释
,
从而更加深刻地揭示事物的内在规律。主成分分析的基本步骤分为
:
①对原始指
标进行标准化
,
以消除变量在数量极或
量纲上的影响
;
②根据标准化后的数据矩阵求出相关系数矩阵
R;
③求出
R
矩阵的特征根和特征向
量
;
④确定主成分
,
结合专业知识对各主成分所蕴含的信
息给予适当的解释
;
⑤合成主成分
,
得到综合评价值。
结合数据进行分析
本题分析的是全国各个省市高校绩效评价,利用全国
2014
年的相关统计数据
(
见
附录
)
,从相关的指标数据我们无法直接评价我国各省市的高等教育绩效,而通
过表
5-6
的相关系数矩阵,可以看到许多的变量之间的相关性很高。如:招生人数与教职工人
数之间具有较强的相关性,教育投入经费和招生人数也具有较强的
相关性,教工人数与本科院校数之间的相关系数最高,到达了
0.963
,而各组成
成分之间的相关性都很高,这也充分说明了主成分分析的必要性。
表
5-6
相关系数矩阵
本科院校
数招生人数教育经费投入
相关性师生比
0.2790.3290.252
重点高校数
0.3450.2040.310
教工人数
0.9630.9540.896
本科院校数
1.0000.9380.881
招生人数
0.9381.0000.893
教育经费投
入
0.8810.8931.000
师生比重点高校数教工人数
相关性师生比
1.000-0.2180.208
重点高校数
-0.2181.0000.433
教工人数
0.2080.4331.000
本科院校数
0.2790.3450.963
招生人数
0.3290.2040.954
教育经费投
入(元)
0.2520.3100.896