机器学习之k-means和DBSCAN的区别

最新推荐文章于 2024-04-19 09:26:31 发布

weixin_30872789

最新推荐文章于 2024-04-19 09:26:31 发布

阅读量4.9k

点赞数 3

文章标签：数据结构与算法

原文链接：http://www.cnblogs.com/hugechuanqi/p/10509307.html

版权

目录

1、定义和区别（优缺点对比）
2、kmeans原理
3、DBSCAN原理

1、定义和区别（优缺点对比）

聚类分为：基于划分、层次、密度、图形和模型五大类；
均值聚类k-means是基于划分的聚类， DBSCAN是基于密度的聚类。区别为：
1. k-means需要指定聚类簇数k，并且且初始聚类中心对聚类影响很大。k-means把任何点都归到了某一个类，对异常点比较敏感。DBSCAN能剔除噪声，需要指定邻域距离阈值eps和样本个数阈值MinPts，可以自动确定簇个数。
2. K均值和DBSCAN都是将每个对象指派到单个簇的划分聚类算法，但是K均值一般聚类所有对象，而DBSCAN丢弃被它识别为噪声的对象。
3. K均值很难处理非球形的簇和不同大小的簇。DBSCAN可以处理不同大小或形状的簇，并且不太受噪声和离群点的影响。当簇具有很不相同的密度时，两种算法的性能都很差。
4. K均值只能用于具有明确定义的质心（比如均值或中位数）的数据。DBSCAN要求密度定义（基于传统的欧几里得密度概念）对于数据是有意义的。
5. K均值算法的时间复杂度是O(m)，而DBSCAN的时间复杂度是O(m^2)。
6. DBSCAN多次运行产生相同的结果，而

最低0.47元/天解锁文章

weixin_30872789

关注

3
点赞
踩
39

收藏

觉得还不错? 一键收藏
0
评论
机器学习之k-means和DBSCAN的区别

目录 1、定义和区别（优缺点对比） 2、kmeans原理 3、DBSCAN原理 1、定义和区别（优缺点对比）聚类分为：基于划分、层次、密度、图形和模型五大类；均值聚类k-means是基于划分的聚类， DBSCAN是基于密度的聚类。区别为：k-means需要指定聚类簇数k，...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。