(1)主成分分析的基本思想和性质:
···主成分分析(Principal Component Analysis,PCA), 是一种统计方法。通过正交变换将一组可能存在相关性的变量转换为一组线性不相关的变量,转换后的这组变量叫主成分。在保留原始变量尽可能多的信息的前提下达到降维的目的,从而简化问题的复杂性并抓住问题的主要矛盾。
一般来说,利用主成分分析得到的主成分与原始变量之间有如下基本关系:
①每一个主成分都是各原始变量的线性组合
②主成分的数目大大少于原始变量的数目
③主成分保留了原始变量的绝大多数信息
④各主成分之间互不相关
···主成分贡献率(contributing rate of principalcomponent),主成分的方差在所考察的随机变量的总方差中所占的比例,主要用以度量主成分对于原变量变异性的解释能力。第一主成分的贡献率越大,该值用来解释其他变量的能力就越强。主成分累积贡献率是选择有效主成分的重要依据,一般使得累积贡献率在85%以上为宜。
···因子负荷量 是指第k个主成分Y与原始变量X之间的相关系数ρ,因子负荷量的绝对值大小刻画了该主成分的主要意义和成因。
(2)案例分析1
搜集各国运动员如下八项男子径赛运动记录:
x1:100米(秒) x5:1500米(分)
x2:200米(秒) x6:5000米(分)
x3:400米(秒) x7:10000米(分)
x4:800米(秒) x8:马拉松(分)
数据:
………………
library(psych)
data=read.table(“clipboard”,header=T)
head(data)
#提取主成分的书面
fa.parallel(data,fa=“pc”,n.iter=100,show.legend=FALSE) #碎石图
#主成分分析
pc=principal(data,nfactors=2,rotate=“none”,score=TRUE)
pc$weights #求主成分系数
可得主成分系数表达式
将标准化的x代入以上式子,