Kmeans聚类与dbscan聚类对比

本文对比分析了KMeans和DBSCAN两种聚类算法。KMeans是无监督学习,需预设类别数K,受初始聚类中心影响大;而DBSCAN基于密度,能发现任意形状的类,无需预设类别数。KMeans在某些数据集上表现不佳,而DBSCAN在多次运行中结果稳定,能识别核心点、边界点和噪声点。选择合适的聚类算法需考虑数据特性。
摘要由CSDN通过智能技术生成

kmeans聚类

特点:
1.无监督学习

2.人为的输入要聚的类数k

3.一般是计算的欧式距离判断相似性

4.每次随机的选取k个聚类中心,聚类结果受随机选取的类中心影响比较大

5.简单

算法过程:

1.输入训练数据集,类别K

2.随机的选取K条数据,作为K个类的中心

3.计算所有数据到2中的K个类中心的距离

4.根据3的结果,与某个类最近的数据化为一类

5.根据4,从新得到K个类,并计算K个类的中心

6.更新上面的的过程,直到K类数据不再变化或者到达迭代次数位置

R语言代码:

n <- 600
x <- cbind(runif(10, 0, 10)+rnorm(n, sd=0.2), runif(10, 0, 10)+rnorm(n,sd=0.2))

km=kmeans(x,5)

km$cluster #输出的聚类标签
km$centers #输出聚类的中心
par(
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值