R语言 主成分分析

本文介绍了R语言中主成分分析的基本思想、性质及其在实际案例中的应用。通过案例分析展示了如何利用PCA进行数据降维,提取主成分,并通过因子负荷量评估其解释能力。在案例1中,对男子径赛运动记录进行分析,提取了2个公因子,分别是耐力因子和速度因子。案例2中,针对基本建设投资数据,同样提取了2个公因子,解释了大部分原始变量的方差。
摘要由CSDN通过智能技术生成
(1)主成分分析的基本思想和性质:

···主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。在保留原始变量尽可能多的信息的前提下达到降维的目的,从而简化问题的复杂性并抓住问题的主要矛盾。

一般来说,利用主成分分析得到的主成分与原始变量之间有如下基本关系
①每一个主成分都是各原始变量的线性组合
②主成分的数目大大少于原始变量的数目
③主成分保留了原始变量的绝大多数信息
④各主成分之间互不相关

···主成分贡献率(contributing rate of principalcomponent),主成分的方差在所考察的随机变量的总方差中所占的比例,主要用以度量主成分对于原变量变异性的解释能力。第一主成分的贡献率越大,该值用来解释其他变量的能力就越强。主成分累积贡献率是选择有效主成分的重要依据,一般使得累积贡献率在85%以上为宜。

···因子负荷量 是指第k个主成分Y与原始变量X之间的相关系数ρ,因子负荷量的绝对值大小刻画了该主成分的主要意义和成因。

(2)案例分析1

搜集各国运动员如下八项男子径赛运动记录:
x1:100米(秒) x5:1500米(分)
x2:200米(秒) x6:5000米(分)
x3:400米(秒) x7:10000米(分)
x4:800米(秒) x8:马拉松(分)
在这里插入图片描述
数据:
在这里插入图片描述
………………

library(psych)
data=read.table(“clipboard”,header=T)
head(data)
#提取主成分的书面
fa.parallel(data,fa=“pc”,n.iter=100,show.legend=FALSE) #碎石图

在这里插入图片描述

#主成分分析
pc=principal(data,nfactors=2,rotate=“none”,score=TRUE)
pc$weights #求主成分系数

在这里插入图片描述
可得主成分系数表达式
在这里插入图片描述
将标准化的x代入以上式子,

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值