机器学习-无监督学习-聚类：聚类方法（二）--- 基于密度的聚类算法【DBSCAN文本聚类算法，密度最大值文本聚类算法】

u013250861

已于 2022-11-17 11:15:50 修改

阅读量1.7k

点赞数

分类专栏： # ML/聚类(无监督) 文章标签：人工智能聚类基于密度的聚类算法 DBSCAN

于 2021-04-13 11:33:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u013250861/article/details/115659500

版权

ML/聚类(无监督) 专栏收录该内容

11 篇文章 7 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了两种基于密度的聚类算法——DBSCAN和MDCA。DBSCAN能够发现任意形状的聚类，对噪声不敏感，但对参数选择敏感。MDCA通过寻找最高密度点进行聚类，同样适应任意形状簇，但算法复杂，分类速度较慢。

摘要由CSDN通过智能技术生成

密度聚类方法的指导思想是，只要样本点的密度大于某阀值，则将该样本添加到最近的簇中。

基于密度的聚类算法假设聚类结构能够通过样本分布的紧密程度确定，以数据集在空间分布上的稠密程度为依据进行聚类，即只要一个区域中的样本密度大于某个阈值，就把它划入与之相近的簇中。

密度聚类从样本密度的角度进行考察样本之间的可连接性，并由可连接样本不断扩展直到获得最终的聚类结果。这类算法可以克服K-means、BIRCH等只适用于凸样本集的情况。

这类算法能克服基于距离的算法只能发现“类圆形”(凸)的聚类的缺点，课发现任意形状的聚类，且对噪声数据不敏感。但是计算密度单元的计算复杂度大，需要建立空间索引来降低计算量。

常用的密度聚类算法：DBSCAN、MDCA、OPTICS、DENCLUE等。

一、 DBSCAN算法

DBSCAN（Density-Based Spatial Clustering of Applications with Noise）是基于一组邻域参数（ε，MinPts）来描述样本分布的紧密程度，相比于基于划分的聚类方法和层次聚类方法，DBSCAN算法将簇定义为密度相连的样本的最大集合，能够将密度足够高的区域划分为簇，不需要给定簇数量，并可在有噪声的空间数据集中发现任意形状的簇。

1、基本概念(参考西瓜书)：

给定的数据集

了解本专栏

超级会员免费看

关注

0
点赞
踩
17

收藏

觉得还不错? 一键收藏
0
评论
机器学习-无监督学习-聚类：聚类方法（二）--- 基于密度的聚类算法【DBSCAN文本聚类算法，密度最大值文本聚类算法】

密度聚类方法的指导思想是，只要样本点的密度大于某阀值，则将该样本添加到最近的簇中。基于密度的聚类算法假设聚类结构能够通过样本分布的紧密程度确定，以数据集在空间分布上的稠密程度为依据进行聚类，即只要一个区域中的样本密度大于某个阈值，就把它划入与之相近的簇中。密度聚类从样本密度的角度进行考察样本之间的可连接性，并由可连接样本不断扩展直到获得最终的聚类结果。这类算法可以克服K-means、BIRCH等只适用于凸样本集的情况。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。