前些天学习了一个主成分分析图,那个图的作用主要是分析几个主成分能够代表样本变异。今天这个图的主要作用是分析不同样本在PC1和PC2作用下的聚类情况
步骤:
mydata1
#导入数据
pca1
#计算主成分,并获得分析结果。scale=TRUE
表示按照比例缩放,但具体内容不在本文讨论范围,只列出计算公式(scale(x,scale=F,center=T) 计算结果等价于
x-mean(x)
scale(x,scale=T,center=F) 计算结果等价于
x/sqrt(sum(x^2)/(length(x)-1))
scale(x,scale=T,center=T) 计算结果等价于
(x-mean(x))/sd(x)
sd计算标准差)
head(pca1$x)
#查看主成分结果
主成分分析结果
scores=as.data.frame(pca1$x)
#判断pca1$x是否为数据框,如果不是就将其转换为数据框
library(ggplot2)
#载入ggplot2包
ggplot(data=scores,aes(x=PC1,y=PC2,label=rownames(scores)))+geom_hline(yintercept=0,colour="gray65")+geom_vline(xintercept=0,colour="red")+geom_text(colour=