基于spss对因子分析中总方差解释与碎石图中的冲突

引入例题

收集到某年全国31个省市自治区各类经济单位包括国有经济单位、集体经济单位、联营经济单位、股份制经济单位、港澳台经济单位和其他经济单位的年人均收入数据,现希望对全国各地区年人均收入的差异性和相似性进行研究。具体数据在文件名为各地区平均收入.sav

我们使用spss进行因子分析,我们会得到:

 

         我们发现总方差解释中,第一个主成分就可以解释很大部分大部分数据方差,而碎石图中上拐点出现在第二个主成分,这就引起了冲突,这就引起了我们的思考,到底是使用第一个总方差解释的数据还是使用碎石图中的数据。

 然后查阅相关知识得出先结论:

        在因子分析或主成分分析中,总方差解释的特征值是每个主成分(或因子)所包含的方差。第一个主成分的特征值是解释了数据中最大方差的主成分,因此它通常是最大的。当第一个主成分解释了数据中很大一部分的方差时(例如你提供的情况下达到了76.6%),在碎石图中,你会看到从第一个主成分开始,方差解释的增长逐渐变缓,直到出现拐点。
        为什么在碎石图上拐点出现在第二个主成分?这是因为第一个主成分已经解释了大部分数据方差,导致第二个主成分所含方差相对较小。在拐点之后的主成分,方差解释的增长变得更加缓慢,这可能是因为数据中的噪音或随机性较大,导致额外的主成分并没有显著解释更多的方差。
拐点后的主成分通常包含较少的数据方差,这也解释了为什么在拐点之后的主成分对数据解释的贡献相对较小。
        综上所述,总方差解释的特征值中第一个成分能够解释较大部分的方差,导致拐点在碎石图中出现在第二个主成分,因为从第二个主成分开始,方差解释的增长逐渐变缓。这也是为什么在因子分析或主成分分析中,通常会选择拐点之后的主成分进行保留,以确保在降维时保留较多的数据重要信息并避免过度拟合。

 

 

  • 1
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值