DBSCAN聚类

最新推荐文章于 2024-08-13 14:49:06 发布

cyoutetsu

最新推荐文章于 2024-08-13 14:49:06 发布

阅读量432

点赞数

分类专栏：聚类模型机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cyoutetsu/article/details/78083668

版权

机器学习同时被 2 个专栏收录

12 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

DBSCAN聚类

首先需要说明的是，密度的定义为在给定半径范围内样本点的数量。

算法步骤

标记

对于每一个样本点，在其周边的给定半径的范围内，其余样本点的数量不小于指定的数量的话，这个样本点就是核心点(core point)
如果小于指定的最小值，但是其半径范围内有核心点的话，这个点就是边界点(border point)
剩下的点称为噪声点(noise point)

划分

每个核心点或者距离相近的几个核心点可以被划分为一个单独的簇
每个边界点划分到其对应的核心点所在的簇中

优缺点

优点：

和K-Means比较，对聚类数据集的类型没有要求，我们知道K-means要求数据集最好是球状的，而密度聚类则没有这个困扰，它可以对任意形状的数据集进行聚类。
异常点的识别，根据之前对于不同点的划分，密度聚类是可以划分出异常点的，而K-means则不行。

缺点：

维度灾难：随着数据集中特征数量的增加，维度灾难的负面影响也会随之递增。
选择最小值点和半径，和K-means中选择K值类型，选择不同的这两个数据也会对聚类效果产生不同的影响。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。