1 导言
因子分析是将多个实测变量简化为较少变量的方法。
利用因子分析能简化分析,更能反映事物本质。
学习因子分析能确定哪些变量应该保留,哪些应该剔除,并得到主要成分的表达式,这些表达式是原有变量的线性组合,而用这些主要成分便能代替原来众多的实测变量。
2 因子分析的功能与应用
由于在实际工作中,指标间经常具备一定的相关性,故人们希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。
3 因子分析实例
例:表12-1 是25名健康人的7项生化检验结果,7项生化检验指标一次命名为X1-X7,请对该资料进行因子分析。
![33a255f0deb753bbb4aa616e86dc7448.png](https://i-blog.csdnimg.cn/blog_migrate/2b742be3099eab83e5b09dad53cae0e8.jpeg)
建立数据文件,定义变量名:分别为X1、X2、X3、X4、X5、X6、X7,按顺序输入相应数值,如图12-1所示。
![a202ca2632c8545080f5f55287d8f8cd.png](https://i-blog.csdnimg.cn/blog_migrate/83207a67a602f4c9744d857f5775ae77.jpeg)
从Analyze----Data Reduction----Factor,弹出Factor Analysis对话框。在对话框左侧变量列表中选变量X1-X7,点击向右的箭头按钮使之进入Variables框,如图12-2所示。
![231c03c50ac84cc440ab549962eb771d.png](https://i-blog.csdnimg.cn/blog_migrate/2bba93a8f13dd87972fe6e464411532d.jpeg)
点击Descriptives按钮,弹出Factor Analysis: Descriptives对话框,在Statistics 中选Univariate descriptives 项要求输出各变量的均数与标准差,在Correlation Matrix栏中选Coefficients 项要求计算相关系数矩阵,并选KMO and Bartlett’s test of sphericity 项,要求对相关系数矩阵进行统计学检验,如图12-3所示。点击Continue 按钮返回Factor Analysis对话框。
![e239bba03ff455884c51b0fba8cc95c6.png](https://i-blog.csdnimg.cn/blog_migrate/8d08ca1c96698234968cdb25fbe26aeb.jpeg)
点击Extraction 按钮,弹出Factor Analysis: Extraction对话框,本例选用Principal components 方法,如图12-5所示。之后点击Continue 按钮返回Factor Analysis 对话框。
![10b51e5f5fc803b3ba1429530a2a754d.png](https://i-blog.csdnimg.cn/blog_migrate/fb97df0c7dc9c58fdcb50107e19f04df.jpeg)
点击Scores 按钮,弹出Factor Analysis: Scores 对话框,系统提供3种估计因子得分系数的方法,本例选用Regression(回归因子得分),如图12-6所示。之后点击Continue 按钮返回Factor Analysis 对话框,再点击OK按钮即完成分析。
![5db9a92f9dac31151521ecbb00f86daf.png](https://i-blog.csdnimg.cn/blog_migrate/56e3e134cb685696bb789896de912227.jpeg)
得到结果如下表12-2 到表12-9 和图12-7 所示。
![c1f3bd6c1fb81327263c702e2af5917d.png](https://i-blog.csdnimg.cn/blog_migrate/4e45b0cf8df56895a3649754dc6e0a74.jpeg)
![52af8e889eb1dc33455f7cc87aaeced2.png](https://i-blog.csdnimg.cn/blog_migrate/5926064d251f2bda942467807b6a024f.jpeg)
![b454ebed203a6e8bedfc2c31c777efd3.png](https://i-blog.csdnimg.cn/blog_migrate/5fc873cd57d502be06fe3f847c8d0858.jpeg)
![628fb91126ce88096e91b9d7effdf583.png](https://i-blog.csdnimg.cn/blog_migrate/e36788230068c9ea9eb0a37555c8e5af.jpeg)
![d7605eb1810a6023b6c2d3c493922a09.png](https://i-blog.csdnimg.cn/blog_migrate/3fa96a6a7810e2a981b510074c2cfc39.jpeg)
![4f97f564c8b50cd2b131599155280e59.png](https://i-blog.csdnimg.cn/blog_migrate/a71f15f1c585b822eacc404304075b9d.jpeg)
![a790a47f721f2e415ae8db942cd4514f.png](https://i-blog.csdnimg.cn/blog_migrate/3121c73aeaad3247fcb5c8ace9421cbd.jpeg)
![7ac7096123c7b4550af84f3dd0cdd2a8.png](https://i-blog.csdnimg.cn/blog_migrate/7b7b9d4450211089bf1bfa0a9fdea659.jpeg)
结果分析:
表12-2、12-3、12-4 显示,系统首先输出各变量的均数(Mean)与标准差(Std Dev),并显示共有25例观察单位进入分析:接着输出相关系数矩阵(Correlation Matrix),经过Bartlett检验表明:Bartlett值=326.285,P小于0.0001,即相关矩阵不是一个单位矩阵,故考虑进行因子分析;Kaiser-Meyer-Olkin Measure of Sampling Adequacy 是用于比较观测相关系数值与偏相关系数值的一个指标,其值越逼近1,表明这些变量进行因子分析效果越好,今KMO值=0.321,偏小,意味着因子分析的结果可能不能接受。
表12-5、12-6 、12-7显示,使用主成分分析法得到2个因子,因子矩阵(Factor Matrix)如下,变量与某一因子的联系系数绝对值越大,则该因子与变量关系越近。如本例变量X7与第一因子的值为-0.886,与第二因子的值为0.219,可见其与第一因子更近,与第二因子更远,或者因子矩阵也可以作为因子贡献大小的度量,其绝对值越大,贡献也越大。在Final Statistics 一栏中显示了各因子解释掉方差的比例,也称变量的共同度(Communality)。共同度从0到1,0为因子且不解释任何方差,1 为所有方差均被因子解释掉。一个因子解释掉变量的方差越大,说明因子包含原有变量信息的量越多。
表12-8和表12-9 显示,经正交旋转后的因子负荷矩阵(Rotated Factor Matrix)和因子转换矩阵(Factor Transformation Matrix)。旋转的目的是使复杂的矩阵变得简洁,即第一因子替代了X1、X2、X4、X7的作用,第二因子替代了X3、X5、X6的作用。
图12-7显示,将第一因子的因子分用变量名fac-1、第二以你这的因子分用变量名fac-2存入原始数据库中。这些值既可用于模型诊断,又可用于进一步分析。
如果有帮助到你,请关注公众号“药小姐呀”更多关于数据分析的内容分享给你,谢谢你这么可爱还关注我。