原文链接:https://blog.csdn.net/weixin_42513170/article/details/112375658
主成分分析在SPSS中的操作和应用。
【例】:对30 名中学生期中考试的成绩进行主成分分析,包含语文(x1)、数学(x2)、英语(x3)、物理(x4)、化学(x5)、生物(x6)、美术(x7)和音乐(x8)8门课程。
注:本题数据纯属虚构,只为操作训练和结果解读。
![4945e2cec91e98d417536ad5460b91ca.png](https://img-blog.csdnimg.cn/img_convert/4945e2cec91e98d417536ad5460b91ca.png)
一、操作说明
1. 数据标准化
打开数据文件CJ.sav,点击“分析→描述统计→描述”,打开描述主对话框,将相关变量选进“变量”,勾选“将标准化的分另存为变量(Z)”,点击确定,见下图;
![23f4130a1194571a3a7da55d2d8d84ee.png](https://img-blog.csdnimg.cn/img_convert/23f4130a1194571a3a7da55d2d8d84ee.png)
![b6e1d37fafb38255b84e05a513558aea.png](https://img-blog.csdnimg.cn/img_convert/b6e1d37fafb38255b84e05a513558aea.png)
2. 主成分分析
(1)点击“分析→降维→因子分析”,打开因子分析主对话框,点击“描述”按钮,打开“描述统计”对话框,勾选“原始分析结果”和“KMO和Bartlett的球形度检验”,点击继续,见下图:
![2a5e3fb975e300eac4d8de2201bf3f8e.png](https://img-blog.csdnimg.cn/img_convert/2a5e3fb975e300eac4d8de2201bf3f8e.png)
(2)点击“抽取”按钮,打开抽取对话框,“分子”选择“主成份”,其他默认,点击继续,见下图:
![0f5f6c6a056181d7f5c3c61689135531.png](https://img-blog.csdnimg.cn/img_convert/0f5f6c6a056181d7f5c3c61689135531.png)
(3)点击“得分”按钮,默认,点击继续,见下图:
![2af8a42cd775582dcaedd9a7bc6a901f.png](https://img-blog.csdnimg.cn/img_convert/2af8a42cd775582dcaedd9a7bc6a901f.png)
(4)其他默认,点击“确定”按钮,得到结果。
二、结果解释
1.KMO和Bartlett检验表
Ø KMO抽样适当性用于研究变量之间的偏相关系数,KMO值越接近1,表明这些变量进行因子分析的效果越好,大于0.9效果最佳,0.7以上可以接受,0.5以下不宜做因子分析。
Ø Bartlett球形检定,近似卡方,显著性p<0.001表明变量高度相关,足够为因子分析提供合理基础。
![bc418cc06fe0c35878dd277cbf03a5cc.png](https://img-blog.csdnimg.cn/img_convert/bc418cc06fe0c35878dd277cbf03a5cc.png)
本例KMO为0.711>0.7,说明数据可以做因子分析;Bartlett球形检定显著性p=0.000说明该例变量可以为因子分析提供合理基础。
2. 公因子方差(Communalities)表
此表得出原始变量的公因子方差,结果中“提取”表示变量公因子方差的值。
![2d7135165bbd7064c08f7673f19c67be.png](https://img-blog.csdnimg.cn/img_convert/2d7135165bbd7064c08f7673f19c67be.png)
本例中语文的公因子方差为0.848,说明几个公因子能够解释语文的方差的84.8%;其他类似。
3. 总方差解释(total variance explained)表
Ø 起始特征值大于1,是有用因子的通用标准。当特征值小于1时,说明这个因子中得到的信息不足以证明应该保留。
Ø 累计%,用来说明因子的贡献率,累计%越高表明这几个因子对总体的解释度越高。一般累计%高于70%表明比较满意。
![fc8833289b7088a47e6aa214819c9f4d.png](https://img-blog.csdnimg.cn/img_convert/fc8833289b7088a47e6aa214819c9f4d.png)
本例中前3个成分特征值均大于1,且累计贡献率=79.393%,说明这3个因子对总体的解释率近80%,故可以提取前3个因子。
4. 成分矩阵表
初始未旋转的因子载荷,显示3个主成分。
![3908e3297060eeda827e4e8ee34fd38d.png](https://img-blog.csdnimg.cn/img_convert/3908e3297060eeda827e4e8ee34fd38d.png)
本例中数学、物理、化学、生物在成分一上有较高载荷,说明成分一基本反映了这些学科的信息;其他类似。所以这3个成分是可以基本反映原来的8个变量的,说明提取3个主成分便可以了。
5. 主成分载荷矩阵表
这3个新变量的表达不能从输出窗口直接得到,因为“成分矩阵”是指初始因子的载荷矩阵,而每一个载荷量表示主成分与对应变量的相关系数。根据数理统计的相关知识,主成分分析的变换矩阵(主成分载荷矩阵Ui)与因子载荷矩阵Ai和特征值λi之间存在一定的数学关系:
![b930066bd7c9f52f23521b571ba4025f.png](https://img-blog.csdnimg.cn/img_convert/b930066bd7c9f52f23521b571ba4025f.png)
①新建“因子载荷矩阵.sav”(数据为成分矩阵表中数据),见下图:
![96d8f2b9b5c0fd1fa31c5ec5c5ef3a9b.png](https://img-blog.csdnimg.cn/img_convert/96d8f2b9b5c0fd1fa31c5ec5c5ef3a9b.png)
②点击“转换→计算变量”,打开计算变量主对话框,在“目标变量”中输入新变量名U1,在“数字表达式”中输入“A1/SQRT(3.677)”,点击确定;依次得到U2和U3。
![d3c18ed6b83f7e4d74fa565bc6f9dada.png](https://img-blog.csdnimg.cn/img_convert/d3c18ed6b83f7e4d74fa565bc6f9dada.png)
![766706f0df6ea6a22dc718697f301213.png](https://img-blog.csdnimg.cn/img_convert/766706f0df6ea6a22dc718697f301213.png)
6. 主成分表达式
将Ui与8个变量的标准值Zxi相乘即可得到3个主成分Y1、Y2、Y3的表达式:
![ca14b28e0f8edbfee4e962e915e6097a.png](https://img-blog.csdnimg.cn/img_convert/ca14b28e0f8edbfee4e962e915e6097a.png)
点击“转换→计算变量”,打开“计算变量”主对话框,“目标变量”输入Y1,“数字表达式”输入上述表达式,点击确定,即可得出Y1。
![c0e7efec843a805f6bad5e69bc067608.png](https://img-blog.csdnimg.cn/img_convert/c0e7efec843a805f6bad5e69bc067608.png)
根据上述步骤,就可依次得到Y1、Y2和Y3,见下图:
![6ef87f3009234fd622d56bad0c9526dc.png](https://img-blog.csdnimg.cn/img_convert/6ef87f3009234fd622d56bad0c9526dc.png)
7. 综合主成分值
以3个主成分所对应的特征值占所提取主成分总的特征值之和的比例作为权重,计算主成分综合模型;根据主成分综合模型即可算出综合主成分值。
![5c62ff010d70f7e9e47c08b54016e920.png](https://img-blog.csdnimg.cn/img_convert/5c62ff010d70f7e9e47c08b54016e920.png)
本例中即为:
![aa3ac4ccbce9ec5784b6775b907b2253.png](https://img-blog.csdnimg.cn/img_convert/aa3ac4ccbce9ec5784b6775b907b2253.png)
![6722c6d159027c613013ccba2a56fad6.png](https://img-blog.csdnimg.cn/img_convert/6722c6d159027c613013ccba2a56fad6.png)
点击“转换→计算变量”打开“计算变量”主对话框,在“目标变量”中输入Y,在表达式中输入上述表达式,点击确定,即可得到结果,见下图:
![b3739900943b14b2a0153107148223f5.png](https://img-blog.csdnimg.cn/img_convert/b3739900943b14b2a0153107148223f5.png)
对得出的综合主成分值,可用实际结果、经验与原始数据做聚类分析进行检验,对有争议的结果,可用原始数据做判断分析解决争议。具体应用请大家自行检验,多多练习,多多指教。
以上就是本节的全部内容,请大家多多练习~