PCA, 3d可视化以及R聚类

本文记录了使用R进行主成分分析PCA、3D数据可视化以及Hierarchical聚类的过程。首先,通过导入iris数据集并查看数据概况。接着,运用PCA进行降维分析,并通过summary()函数展示结果。然后,利用rgl包创建3D可视化效果,最后进行了Hierarchical聚类,完成了数据分析任务。
摘要由CSDN通过智能技术生成

学习中用到了,简单进行记录一下实现的过程,具体如下

导入数据

数据使用的是iris数据包:

data(iris)
iris$Species <- factor(iris$Species, levels = c("Versicolor", "virginica", "setosa"))

可以使用head(iris)来查看数据情况。

可以简单看看数据的拟合情况:

round(cor(iris[,1:4]),2)

主成分分析PCA

pca <- princomp(iris[,1:4], cor=TRUE, scores=TRUE)//选择研究correlation

通过summary(pc)可以查看计算结果
绘制结果:

plot(pc, type="lines")
biplot(pc)

3D可视化

要想进行3D的研究,可以选择使用rgl包,如果没有的话可以使用install.packages(“rgl”)进行安装

具体实现:

library(rgl)
plot3d(pc$scores[,1:3],col=iris$Species)

text3d(pc$scores[,1:3],texts=rownames(iris))
text3d(pc$loadings[,1:3], texts=rownames(pc$loadings), col="red")
coords <- NULL
for (i in 1:nrow(pc$loa
K-means是一种常用的聚类算法,可以对多维数据进行聚类分析。在进行K-means聚类之前,我们首先需要确定聚类的数量K,然后随机选择K个初始质心。然后,根据每个样本与质心的距离将样本分配给最近的质心,形成K个簇。接下来,计算每个簇的新质心,并重复上述过程,直到质心不再发生变化或迭代次数达到预设值。 为了将多维数据的聚类结果进行可视化,常用的方法是降维。其中,主成分分析(PCA)是一种常用的降维方法。通过PCA,可以将原始高维数据映射到一个较低维的空间中,以便于可视化展示。 一种常见的可视化方法是散点图。在散点图中,每个数据点表示一个样本,不同颜色或符号的点表示不同的簇。我们可以在降维后的空间中显示每个样本的特征值或特征向量。此外,我们还可以使用柱状图或雷达图等其他可视化方法来展示聚类结果。 另一种可视化方法是使用网络图。在网络图中,节点表示样本,边表示样本之间的相似度或连接性。通过将同一簇的节点连接起来,可以直观地显示出不同簇之间的关系和联系。 除了降维和网络图,还可以使用其他可视化技术,如热图、聚类轮廓图等。这些方法可以帮助我们更好地理解多维数据的聚类特征,从而进一步分析和利用聚类结果。总之,K-means可以通过不同的可视化方法对多维数据进行聚类可视化,帮助我们理解数据的聚类结构和特征。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值