R语言也有“一步到位”的函数,如prcomp()和princomp(),基本上都是输入数据直接出结果。为了理解PCA的原理,我们利用自编函数的方法进行学习。
主成分分析详解
主成分分析过程分解
1.数据标准化
为了统一数据的量纲并对数据进行中心化,在主成分分析之前往往需要对原始数据进行标准化。下面以R语言自带的iris范例数据集为例,探索一下主成分分析的具体过程。
#将R自带的范例数据集iris储存为变量data;
data<-iris
head(data)
#对原数据进行z-score归一化;
dt<-as.matrix(scale(data[,1:4]))
head(dt)
2.计算相关系数(协方差)矩阵
既然主成分分析主