主成分与因子分析异同_因子分析

因子分析用于简化多个相关变量,通过实例展示了如何使用因子分析处理25名健康人的7项生化检验数据。通过对相关系数矩阵的Bartlett检验和KMO值分析,确定进行因子分析的合理性,采用主成分法提取两个因子,揭示了各因子对原始变量的贡献度和共同度。正交旋转后,因子负荷矩阵清晰地显示了因子如何替代原有变量。
摘要由CSDN通过智能技术生成

1 导言

因子分析是将多个实测变量简化为较少变量的方法。

利用因子分析能简化分析,更能反映事物本质。

学习因子分析能确定哪些变量应该保留,哪些应该剔除,并得到主要成分的表达式,这些表达式是原有变量的线性组合,而用这些主要成分便能代替原来众多的实测变量。

2 因子分析的功能与应用

由于在实际工作中,指标间经常具备一定的相关性,故人们希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。

3 因子分析实例

例:表12-1 是25名健康人的7项生化检验结果,7项生化检验指标一次命名为X1-X7,请对该资料进行因子分析。

33a255f0deb753bbb4aa616e86dc7448.png

建立数据文件,定义变量名:分别为X1、X2、X3、X4、X5、X6、X7,按顺序输入相应数值,如图12-1所示。

a202ca2632c8545080f5f55287d8f8cd.png

从Analyze----Data Reduction----Factor,弹出Factor Analysis对话框。在对话框左侧变量列表中选变量X1-X7,点击向右的箭头按钮使之进入Variables框,如图12-2所示。

231c03c50ac84cc440ab549962eb771d.png

点击Descriptives按钮,弹出Factor Analysis: Descriptives对话框,在Statistics 中选Univariate descriptives 项要求输出各变量的均数与标准差,在Correlation Matrix栏中选Coefficients 项要求计算相关系数矩阵,并选KMO and Bartlett’s test of sphericity 项,要求对相关系数矩阵进行统计学检验,如图12-3所示。点击Continue 按钮返回Factor Analysis对话框。

e239bba03ff455884c51b0fba8cc95c6.png

点击Extraction 按钮,弹出Factor Analysis: Extraction对话框,本例选用Principal components 方法,如图12-5所示。之后点击Continue 按钮返回Factor Analysis 对话框。

10b51e5f5fc803b3ba1429530a2a754d.png

点击Scores 按钮,弹出Factor Analysis: Scores 对话框,系统提供3种估计因子得分系数的方法,本例选用Regression(回归因子得分),如图12-6所示。之后点击Continue 按钮返回Factor Analysis 对话框,再点击OK按钮即完成分析。

5db9a92f9dac31151521ecbb00f86daf.png

得到结果如下表12-2 到表12-9 和图12-7 所示。

c1f3bd6c1fb81327263c702e2af5917d.png

52af8e889eb1dc33455f7cc87aaeced2.png

b454ebed203a6e8bedfc2c31c777efd3.png

628fb91126ce88096e91b9d7effdf583.png

d7605eb1810a6023b6c2d3c493922a09.png

4f97f564c8b50cd2b131599155280e59.png

a790a47f721f2e415ae8db942cd4514f.png

7ac7096123c7b4550af84f3dd0cdd2a8.png

结果分析:

表12-2、12-3、12-4 显示,系统首先输出各变量的均数(Mean)与标准差(Std Dev),并显示共有25例观察单位进入分析:接着输出相关系数矩阵(Correlation Matrix),经过Bartlett检验表明:Bartlett值=326.285,P小于0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析;Kaiser-Meyer-Olkin Measure of Sampling Adequacy 是用于比较观测相关系数值与偏相关系数值的一个指标,其值越逼近1,表明这些变量进行因子分析效果越好,今KMO值=0.321,偏小,意味着因子分析的结果可能不能接受。

表12-5、12-6 、12-7显示,使用主成分分析法得到2个因子,因子矩阵(Factor Matrix)如下,变量与某一因子的联系系数绝对值越大,则该因子与变量关系越近。如本例变量X7与第一因子的值为-0.886,与第二因子的值为0.219,可见其与第一因子更近,与第二因子更远,或者因子矩阵也可以作为因子贡献大小的度量,其绝对值越大,贡献也越大。在Final Statistics 一栏中显示了各因子解释掉方差的比例,也称变量的共同度(Communality)。共同度从0到1,0为因子且不解释任何方差,1 为所有方差均被因子解释掉。一个因子解释掉变量的方差越大,说明因子包含原有变量信息的量越多。

表12-8和表12-9 显示,经正交旋转后的因子负荷矩阵(Rotated Factor Matrix)和因子转换矩阵(Factor Transformation Matrix)。旋转的目的是使复杂的矩阵变得简洁,即第一因子替代了X1、X2、X4、X7的作用,第二因子替代了X3、X5、X6的作用。

图12-7显示,将第一因子的因子分用变量名fac-1、第二以你这的因子分用变量名fac-2存入原始数据库中。这些值既可用于模型诊断,又可用于进一步分析。

如果有帮助到你,请关注公众号“药小姐呀”更多关于数据分析的内容分享给你,谢谢你这么可爱还关注我。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值