SPSS 主成分分析(Principal Component Analysis,PCA)

定义

主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。
转化生成的综合指标称之为主成分,其中每个主成分都是原始变量的线性组合,且各个主成分之间互不相关,这就使得主成分逼原始变量具有某些更优越的性能。

基本原理

如果用 x 1 , x 2 , . . . , x p x_1,x_2,...,x_p x1,x2,...,xp表示 p p p门课程, c 1 , c 2 , . . . , c p c_1,c_2,...,c_p c1,c2,...,cp表示各门课程的权重,那么加权之和就是 s = c 1 x 1 + c 2 x 2 + . . . + c p x p s=c_1x_1+c_2x_2+...+c_px_p s=c1x1+c2x2+...+cpxp我们希望选择适当的权重能更好的地区分学生的成绩。每个学生都对应这样一个综合成绩,即为 s 1 , s 2 , . . . s n s_1,s_2,...s_n s1,s2,...sn n n n为学生人数。
我们需要的是能找到合适的 c 1 , c 2 , . . . , c p c_1,c_2,...,c_p c1,c2,...,cp,使得 s 1 , s 2 , . . . , s n s_1,s_2,...,s_n s1,s2,...,sn能尽可能的分散。
当然,必须加上某种限制,否则权值可选择无穷大而没有意义,通常规定
c 1 2 + c 2 2 + . . . + c p 2 = 1 c_1^2+c_2^2+...+c_p^2=1 c12+c22+...+cp2=1
一个主成分不足以代表原来的 p p p个变量,因此需要寻找第二个乃至第三、四个主成分,第二个
主成分不应该再包含第一个主成分的信息,统计上的描述就是让这两个主成分的协方差为零,几何上就是这两个主成分的方向正交。具体确定各个主成分的方法如下。
Z i Z_i Zi表示第 i i i个主成分, i = 1 , 2 , . . . , p i=1,2,...,p i=1,2,...,p,可设
{ Z 1 = c 11 X 1 + c 12 X 2 + ⋯ + c 1 p X p Z 2 = c 21 X 1 + c 22 X 2 + ⋯ + c 2 p X p ⋯ … … … … … … … … . . Z p = c p 1 X 1 + c p 2 X 2 + ⋯ + c p p X p \left\{\begin{array}{l} Z_{1}=c_{11} X_{1}+c_{12} X_{2}+\cdots+c_{1 p} X_{p} \\ Z_{2}=c_{21} X_{1}+c_{22} X_{2}+\cdots+c_{2 p} X_{p} \\ \cdots \ldots \ldots \ldots \ldots \ldots \ldots \ldots \ldots . . \\ Z_{p}=c_{p 1} X_{1}+c_{p 2} X_{2}+\cdots+c_{p p} X_{p} \end{array}\right. Z1=c11X1+c12X2++c1pXpZ2=c21X1+c22X2++c2pXp..Zp=cp1X1+cp2X2++cppXp
其中对每一个 i i i,均有 c 1 2 + c 2 2 + . . . + c p 2 = 1 c_1^2+c_2^2+...+c_p^2=1 c12+c22+...+cp2=1

案例分析

在这里插入图片描述
在这里插入图片描述
SPSS操作步骤
分析→降维→ 因子

在这里插入图片描述

在这里插入图片描述
一般来说,由协方差矩阵出发求解主成分所得结果与由相关矩阵出发求解主成分所得结果有很大不同。对于度量单位不同的指标或取值范围彼此差异非常大的指标,不能直接由其协方差矩阵出发进行主成分分析,而应该考虑将数据标准化(从相关矩阵出发)。
对于同度量单位或取值范围在同量级的数据还是直接从协方差矩阵求解。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

输出

在这里插入图片描述
在这里插入图片描述
检验各因素之间有没有关联程度,一般情况下, K M O KMO KMO值应大于等于 0.6 0.6 0.6 S i g Sig Sig值应小于等于 0.05 0.05 0.05
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

PCA主成分分析是一种统计方法,它可以通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的主成分,从而实现降维。这种方法能够在保留较少信息的前提下,将多个指标转化为少数几个综合指标,这些综合指标能够更好地代表原始变量的特征。在环境学领域,PCA分析可以用来反映样本之间的总体差异和组内样本之间的变异度大小。在SPSS软件中,我们可以使用菜单式的PCA分析来计算样本的主成分综合得分,从而评价某种综合指标的水平。标准化是进行PCA分析的一个重要步骤,常用的标准化方法有最小-最大标准化和Z-score标准化。如果需要确定多个主成分,则需要确保这些主成分互不相关且方向正交。 [1 [2 [3123 #### 引用[.reference_title] - *1* *2* [基于SPSS主成分分析PCA)](https://blog.csdn.net/HUANWEIFENXI/article/details/124130347)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}} ] [.reference_item] - *3* [运用SPSS进行PCA主成分分析(因子分析)](https://blog.csdn.net/LIsaWinLee/article/details/104781414)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT0_1"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值