机器学习之经典算法（十五）DBSCAN算法

最新推荐文章于 2024-07-11 13:52:29 发布

AI专家

最新推荐文章于 2024-07-11 13:52:29 发布

阅读量4.7k

点赞数

分类专栏：机器之巅修炼之路

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42039090/article/details/80710661

版权

DBSCAN是一种基于密度的聚类算法，寻找密度相连的点的最大集合，能发现任意形状的聚类并识别噪声点。它不需要预先设定簇的数量，但对高维数据和密度变化的数据表现不佳。参数Eps和MinPts需要根据数据特性设置，Eps可通过k-距离曲线确定。在Python中，使用sklearn库的DBSCAN可进行聚类，通过调整参数观察不同聚类效果。

摘要由CSDN通过智能技术生成

一、DBSCAN算法简介：

DBSCAN(Density-Based SpatialClustering of Application with Noise)，是一种基于密度的聚类算法。与划分和层次聚类方法不同，它将簇定义为密度相连的点的最大集合，能够把具有足够高密度的区域划分为簇，并可在噪声的空间数据库中发现任意形状的聚类。其目标是寻找被低密度区域分离的高密度区域，通俗点说就是把扎堆的点（高密度）找出来，而点很少很稀疏的地方（低密度）就作为分割区域。

（1）基本原理：

① DBSCAN通过检查数据集中每点的Eps邻域来搜索簇，如果点p的Eps邻域包含的点多于MinPts个，则创建一个以p为核心对象的簇；

② 然后，DBSCAN迭代地聚集从这些核心对象直接密度可达的对象，这个过程可能涉及一些密度可达簇的合并；

③ 当没有新的点添加到任何簇时，该过程结束。

优点：

① 与K-means方法相比，DBSCAN不需要事先知道要形成的簇类的数量。

② 与K-means方法相比，DBSCAN可以发现任意形状的簇类。同时，DBSCAN能够识别出噪声点。

③ DBSCAN对于数据库中样本的顺序不敏感，即Pattern的输入顺序对结果的影响不大。

缺点：

最低0.47元/天解锁文章

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
机器学习之经典算法（十五）DBSCAN算法

一、DBSCAN算法简介： DBSCAN(Density-Based SpatialClustering of Application with Noise)，是一种基于密度的聚类算法。与划分和层次聚类方法不同，它将簇定义为密度相连的点的最大集合，能够把具有足够高密度的区域划分为簇，并可在噪声的空间数据库中发现任意形状的聚类。其目标是寻找被低密度区域分离的高密度区域，通俗点说就是把扎...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。