人的全面发展评价指标体系—基于相关-主成分分析构建

本文先从经济、社会、生活质量和人口素质四个方面海选了众多人的全面发展评价指标,然后根据可观测性原则剔除无法获得的指标进行了初步筛选,再利用相关性分析删除相关系数大的指标,以及通过主成分分析删除因子负载小的指标,完成了定量筛选,最终构建了由14个变量组成的评价指标体系,利用17%的指标反映了99%的原始信息。

一、 筛选步骤

1.海选出大量指标,并进行标准化

2.根据可观测性原则删除无法获得的评价指标

此步骤删除指标:

3.通过相关性分析删除同一准则层内相关系数大的指标

此步骤删除指标:

4.通过主成分分析删除了因子负载小的指标

此步骤删除指标:


 

二、 合理性判定标准

构建指标的信息贡献率:

为指标数据的协方差矩阵;为协方差矩阵的迹;为筛选后的指标个数;为海选指标的个数。

如果用30%以下的海选指标反映了95%以上的原始信息,则认为指标体系构建合理。

三、 结果

从海选指标中最终保留了人均GDP、城镇居民可支配收入、农民人均纯收入、农村居民非农就业率、基尼系数、社会保障覆盖率、每万人医生数、国民幸福指数、恩格尔系数、人均住房面积、人均绿地面积、平均受教育年限、科技文卫支出/GDP、每万人拥有科技人员数等14个指标。最终信息贡献率为98.9%。

数据概况:

以下为我们对筛选后指标进行的主成分分析实证结果:

1.判断是否适合做主成分分析

先对变量进行相关性分析,得到所有变量之间的方差-协方差矩阵。可以发现很多变量之间的相关关系是非常强的甚至有的超过了90%,这说明变量之间存在着相当数量的信息重叠。并且SMC与KMO检验得到的结果表明变量的线性关系很强。进行主成分分析把众多的初始变量整合成少数几个相互之间无关的主成分变量是非常必要的。


2.主成分分析

结果可以发现,stata总共提取了14个主成分。可以发现第一个主成分的方差贡献率是0.7649,表示该主成分解释了所有变量的76.49%的信息。

只保留特征值大于1的主成分:

碎石图:

        screeplot

载荷图:

loadingplot

说明:

X14 “农村居民非农业就业比率”使用“非农就业率”代替

X34 “人均绿地面积”使用“人均公园绿地面积”代替

X43 “每万人拥有科技人员数”使用“R&D人员全时当量”代替

下载链接

参考资料:https://download.csdn.net/download/T0620514/88850801

数据集:https://download.csdn.net/download/T0620514/88850800

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

T0620514

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值