PCA, 3d可视化以及R聚类

欧阳人白的一亩三分地

于 2015-06-30 17:19:58 发布

阅读量1w

点赞数 1

分类专栏：数据挖掘

本文链接：https://blog.csdn.net/brunowuestelle/article/details/46698241

版权

本文记录了使用R进行主成分分析PCA、3D数据可视化以及Hierarchical聚类的过程。首先，通过导入iris数据集并查看数据概况。接着，运用PCA进行降维分析，并通过summary()函数展示结果。然后，利用rgl包创建3D可视化效果，最后进行了Hierarchical聚类，完成了数据分析任务。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

学习中用到了，简单进行记录一下实现的过程，具体如下

导入数据

数据使用的是iris数据包：

data(iris)
iris$Species <- factor(iris$Species, levels = c("Versicolor", "virginica", "setosa"))

可以使用head(iris)来查看数据情况。

可以简单看看数据的拟合情况：

round(cor(iris[,1:4]),2)

主成分分析PCA

pca <- princomp(iris[,1:4], cor=TRUE, scores=TRUE)//选择研究correlation

通过summary(pc)可以查看计算结果
绘制结果：

plot(pc, type="lines")
biplot(pc)

3D可视化

要想进行3D的研究，可以选择使用rgl包，如果没有的话可以使用install.packages(“rgl”)进行安装

具体实现：

library(rgl)
plot3d(pc$scores[,1:3],col=iris$Species)

text3d(pc$scores[,1:3],texts=rownames(iris))
text3d(pc$loadings[,1:3], texts=rownames(pc$loadings), col="red")
coords <- NULL
for (i in 1:nrow(pc$loa