Kmeans聚类与dbscan聚类对比

最新推荐文章于 2024-08-13 22:52:37 发布

氵冫丶

最新推荐文章于 2024-08-13 22:52:37 发布

阅读量8.3k

点赞数

文章标签： kmeans dbscan R

本文链接：https://blog.csdn.net/qunxingvip/article/details/46687435

版权

本文对比分析了KMeans和DBSCAN两种聚类算法。KMeans是无监督学习，需预设类别数K，受初始聚类中心影响大；而DBSCAN基于密度，能发现任意形状的类，无需预设类别数。KMeans在某些数据集上表现不佳，而DBSCAN在多次运行中结果稳定，能识别核心点、边界点和噪声点。选择合适的聚类算法需考虑数据特性。

摘要由CSDN通过智能技术生成

kmeans聚类

特点：
1.无监督学习

2.人为的输入要聚的类数k

3.一般是计算的欧式距离判断相似性

4.每次随机的选取k个聚类中心，聚类结果受随机选取的类中心影响比较大

5.简单

算法过程：

1.输入训练数据集，类别K

2.随机的选取K条数据，作为K个类的中心

3.计算所有数据到2中的K个类中心的距离

4.根据3的结果，与某个类最近的数据化为一类

5.根据4，从新得到K个类，并计算K个类的中心

6.更新上面的的过程，直到K类数据不再变化或者到达迭代次数位置

R语言代码：

n <- 600
x <- cbind(runif(10, 0, 10)+rnorm(n, sd=0.2), runif(10, 0, 10)+rnorm(n,sd=0.2))

km=kmeans(x,5)

km$cluster #输出的聚类标签
km$centers #输出聚类的中心
par(