使用DBScan + Kmeans计算区域集聚和中心点

最新推荐文章于 2024-07-22 18:52:16 发布

tonny1228

最新推荐文章于 2024-07-22 18:52:16 发布

阅读量9.9k

点赞数 5

分类专栏：我的原创

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tonny1228/article/details/81115770

版权

我的原创专栏收录该内容

3 篇文章 0 订阅

订阅专栏

DBSCAN，英文全写为Density-based spatial clustering of applications with noise ，是在 1996 年由Martin Ester, Hans-Peter Kriegel, Jörg Sander 及 Xiaowei Xu 提出的聚类分析算法，这个算法是以密度为本的：给定某空间里的一个点集合，这算法能把附近的点分成一组（有很多相邻点的点），并标记出位于低密度区域的局外点（最接近它的点也十分远）.

k-平均算法（英文：k-means clustering）源于信号处理中的一种向量量化方法，现在则更多地作为一种聚类分析方法流行于数据挖掘领域。k-平均聚类的目的是：把{\displaystyle n}个点（可以是样本的一次观察或一个实例）划分到k个聚类中，使得每个点都属于离他最近的均值（此即聚类中心）对应的聚类，以之作为聚类的标准。这个问题将归结为一个把数据空间划分为Voronoi cells的问题。

使用DBScan进行聚类计算

使用K-means进行聚类计算

案例分析

dbscan会剔除噪点，k-means会把任何点都归到了某一个类。

k-means 的中心点不是聚集区域的中心点，而是整个聚类的中心点；DBSCAN 无法找出中心点。

相比 k-means ，DBSCAN 不需要预先声明聚类数量。

DBSCAN 可以找出任何形状的聚类，甚至能找出一个聚类，k-means需要指定集类的个数。

要想找出聚集区域并给出准确的中心点，可以使用DBScan分析聚类个数和聚类包含的点，再通过k-means将每个聚类所包含的点计算出中心点。

蓝色为聚类1，黑色为聚类2，灰色为噪点。

具体算法的实现代码网上有很多介绍，可以参考。

关注

5
点赞
踩
27

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。