人的全面发展评价指标体系—基于相关-主成分分析构建

T0620514

已于 2024-02-19 19:07:41 修改

阅读量870

点赞数 1

文章标签：人工智能算法机器学习

于 2023-05-03 08:07:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/T0620514/article/details/130463141

版权

本文先从经济、社会、生活质量和人口素质四个方面海选了众多人的全面发展评价指标，然后根据可观测性原则剔除无法获得的指标进行了初步筛选，再利用相关性分析删除相关系数大的指标，以及通过主成分分析删除因子负载小的指标，完成了定量筛选，最终构建了由14个变量组成的评价指标体系，利用17%的指标反映了99%的原始信息。

一、筛选步骤

1.海选出大量指标，并进行标准化

2.根据可观测性原则删除无法获得的评价指标

此步骤删除指标：

3.通过相关性分析删除同一准则层内相关系数大的指标

此步骤删除指标：

4.通过主成分分析删除了因子负载小的指标

此步骤删除指标：

二、合理性判定标准

构建指标的信息贡献率:

为指标数据的协方差矩阵；为协方差矩阵的迹；为筛选后的指标个数；为海选指标的个数。

如果用30%以下的海选指标反映了95%以上的原始信息，则认为指标体系构建合理。

三、结果

从海选指标中最终保留了人均GDP、城镇居民可支配收入、农民人均纯收入、农村居民非农就业率、基尼系数、社会保障覆盖率、每万人医生数、国民幸福指数、恩格尔系数、人均住房面积、人均绿地面积、平均受教育年限、科技文卫支出/GDP、每万人拥有科技人员数等14个指标。最终信息贡献率为98.9%。

数据概况：

以下为我们对筛选后指标进行的主成分分析实证结果：

1.判断是否适合做主成分分析

先对变量进行相关性分析，得到所有变量之间的方差-协方差矩阵。可以发现很多变量之间的相关关系是非常强的甚至有的超过了90%，这说明变量之间存在着相当数量的信息重叠。并且SMC与KMO检验得到的结果表明变量的线性关系很强。进行主成分分析把众多的初始变量整合成少数几个相互之间无关的主成分变量是非常必要的。

2.主成分分析

结果可以发现，stata总共提取了14个主成分。可以发现第一个主成分的方差贡献率是0.7649，表示该主成分解释了所有变量的76.49%的信息。

只保留特征值大于1的主成分：

碎石图：

screeplot

载荷图：

loadingplot

说明：

X14 “农村居民非农业就业比率”使用“非农就业率”代替

X34 “人均绿地面积”使用“人均公园绿地面积”代替

X43 “每万人拥有科技人员数”使用“R&D人员全时当量”代替

下载链接

参考资料：https://download.csdn.net/download/T0620514/88850801

数据集：https://download.csdn.net/download/T0620514/88850800

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

T0620514 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。