R语言算法之聚类分析

本文介绍了使用R语言进行聚类分析的方法,包括KMeans聚类和层次聚类。通过鸢尾花数据集展示了KMeans聚类的过程,探讨了如何确定合适的类别数量,如使用碎石图和投票法。同时,提到了K中心聚类法在处理极端值上的优势,以及层次聚类法的谱系图分析。
摘要由CSDN通过智能技术生成

R语言算法之聚类分析

Kmeans聚类

先以已知的鸢尾花数据集为例(它的类已知,为三类)

加载数据集

data(iris)
# 查看数据集结构
head(iris)

插图

数据处理:

图中可以看出,数据的单位差不了多少,不需要对数据集进行标准化处理,但是在进行聚类分析的时候,我们是通过对其他的标量进行分析判断,所以对于分的类(iris里面的Species在新数据集中不需要)
原数据保留,在新建的数据中“动刀动枪”

iris1 <- iris
iris1$Species <- NULL  #删除iris中的Species
library(stats)
set.seed(1234)

模型的建立

kmeans.result <- kmeans(iris1,3)  # kmeans(data,k)
kmeans.result$cluster
table(iris$Species,kmeans.result$cluster)  #对原先数据的分类与模型预测后的分类做交叉表, 
plot(iris1[,c("Sepal.Length","Sepal.Width")],col=kmeans.result$cluster)  # 画图,以x轴为Sepal.Length,y
  • 2
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值