小嘿嘿之常见聚类算法之DBSCAN/k-means/BIRCH

最新推荐文章于 2024-07-22 09:04:47 发布

小嘿嘿a

最新推荐文章于 2024-07-22 09:04:47 发布

阅读量1.4k

点赞数 3

文章标签：聚类

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xyxuyue/article/details/105255871

版权

DBSCAN(基于密度)

${\color{Red}2个算法参数：邻域半径R和最少点数目minpoints。}$
这两个算法参数实际可以刻画什么叫密集——当邻域半径R内的点的个数大于最少点数目minpoints时，就是密集。
在这里插入图片描述
${\color{Red}3种点的类别：核心点，边界点和噪声点。}$
邻域半径R内样本点的数量大于等于minpoints的点叫做核心点。不属于核心点但在某个核心点的邻域内的点叫做边界点。既不是核心点也不是边界点的是噪声点。
在这里插入图片描述
${\color{Red}4种点的关系：密度直达，密度可达，密度相连，非密度相连。}$

在这里插入图片描述

DBSCAN算法步骤：

1：寻找核心点形成临时聚类簇。
扫描全部样本点，如果某个样本点R半径范围内点数目>=MinPoints，则将其纳入核心点列表，并将其密度直达的点形成对应的临时聚类簇。
2：合并临时聚类簇得到聚类簇。
对于每一个临时聚类簇，检查其中的点是否为核心点，如果是，将该点对应的临时聚类簇和当前临时聚类簇合并，得到新的临时聚类簇。
3：重复此操作，直到当前临时聚类簇中的每一个点要么不在核心点列表，要么其密度直达的点都已经在该临时聚类簇，该临时聚类簇升级成为聚类簇。
4：继续对剩余的临时聚类簇进行相同的合并操作，直到全部临时聚类簇被处理。
在这里插入图片描述

DBSCAN算法需考虑的三个问题

${\color{Blue}第一个}$ 是一些异常样本点或者说少量游离于簇外的样本点，这些点不在任何一个核心对象在周围，在DBSCAN中，我们一般将这些样本点标记为噪音点。

最低0.47元/天解锁文章

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
小嘿嘿之常见聚类算法之DBSCAN/k-means/BIRCH

DBSCAN(基于密度)2个算法参数：邻域半径R和最少点数目minpoints。{\color{Red}2个算法参数：邻域半径R和最少点数目minpoints。}2个算法参数：邻域半径R和最少点数目minpoints。这两个算法参数实际可以刻画什么叫密集——当邻域半径R内的点的个数大于最少点数目minpoints时，就是密集。3种点的类别：核心点，边界点和噪声点。{\color{Red}3...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。