机器学习实战——密度聚类算法

最新推荐文章于 2024-09-18 21:48:45 发布

wxw_csdn

最新推荐文章于 2024-09-18 21:48:45 发布

阅读量1.2k

点赞数

分类专栏：机器学习文章标签：机器学习密度聚类 DBSCAN sklearn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wxw_csdn/article/details/86628441

版权

本文介绍了密度聚类算法中的DBSCAN，详细解释了e邻域、核心对象、边界对象和噪声对象的概念，并阐述了算法的迭代过程。在sklearn中的实现中，重点讨论了关键参数如eps、min_samples的含义及其对聚类结果的影响。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

机器学习实战——密度聚类算法

1 密度聚类
2 sklearn中的实现

1 密度聚类

密度聚类假设聚类结构能够通过样本分布的密集程度确定，通常情形下，密度聚类算法从样本密度的角度来考察样本之间的可连接性，并基于可连接样本不断扩展聚类簇以获得最终的聚类结果。
DBSCAN 是一种很典型的密度聚类算法，给定领域参数的半径为 e ，最小样本点为 MinPts 。该算法中几个较重要的概念如下：

e 邻域：给定对象半径为 e 内的区域称为该对象的 e 邻域；
核心对象：如果给定对象 e 邻域内的样本点数大于等于 MinPts，则称该对象为核心对象；
边界对象：在半径 e 内点的数量小于 MinPts，但是落在核心点的邻域内。
噪声对象：既不是核心对象也不是边界对象的样本。
直接密度可达：对于样本集合 D，如果样本点 q 在点 p 的 e 邻域内，并且 p 为核心对象，那么对象 q 从对象 p 直接密度可达。
密度可达：对于样本集合 D，给定一串样本点 $p_1,p_2….p_n，p= p_1,q= p_n$

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。