R语言算法之聚类分析

最新推荐文章于 2024-02-24 13:03:43 发布

weixin_43408110

最新推荐文章于 2024-02-24 13:03:43 发布

阅读量1.7k

点赞数 2

分类专栏： R语言算法

本文链接：https://blog.csdn.net/weixin_43408110/article/details/87607109

版权

本文介绍了使用R语言进行聚类分析的方法，包括KMeans聚类和层次聚类。通过鸢尾花数据集展示了KMeans聚类的过程，探讨了如何确定合适的类别数量，如使用碎石图和投票法。同时，提到了K中心聚类法在处理极端值上的优势，以及层次聚类法的谱系图分析。

摘要由CSDN通过智能技术生成

R语言算法之聚类分析

Kmeans聚类

先以已知的鸢尾花数据集为例（它的类已知，为三类）

加载数据集

data(iris)
# 查看数据集结构
head(iris)

数据处理：

图中可以看出，数据的单位差不了多少，不需要对数据集进行标准化处理，但是在进行聚类分析的时候，我们是通过对其他的标量进行分析判断，所以对于分的类（iris里面的Species在新数据集中不需要）
原数据保留，在新建的数据中“动刀动枪”

iris1 <- iris
iris1$Species <- NULL  #删除iris中的Species
library(stats)
set.seed(1234)

模型的建立

kmeans.result <- kmeans(iris1,3)  # kmeans(data,k)
kmeans.result$cluster
table(iris$Species,kmeans.result$cluster)  #对原先数据的分类与模型预测后的分类做交叉表， 
plot(iris1[,c("Sepal.Length","Sepal.Width")],col=kmeans.result$cluster）  # 画图，以x轴为Sepal.Length，y

最低0.47元/天解锁文章

weixin_43408110

关注

2
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
R语言算法之聚类分析

R语言算法之聚类分析Kmeans聚类先以已知的鸢尾花数据集为例（它的类已知，为三类）加载数据集data(iris)# 查看数据集结构head(iris)数据处理：图中可以看出，数据的单位差不了多少，不需要对数据集进行标准化处理，但是在进行聚类分析的时候，我们是通过对其他的标量进行分析判断，所以对于分的类（iris里面的Species在新数据集中不需要）原数据保留，在新建的数据...
复制链接

扫一扫

专栏目录