聚类算法:DBSCAN

DBSCAN是一种基于密度的聚类算法,它能处理噪声点并发现任意形状的聚类,无需预设聚类数量。该算法涉及核心点、边界点和噪声的定义,以及e-邻域、密度可达和密度相连的概念。伪代码中,ClusterId初始化后通过ExpandCluster函数判断点是否属于簇。使用sklearn库进行DBSCAN聚类,主要调节eps和min_samples参数,通过标签输出和数据可视化展示结果。
摘要由CSDN通过智能技术生成

一、介绍

DBSCAN是一种著名的基于密度的聚类算法,是Martin Ester、Hans-Peter Kriegel等人在1996年提出来的(参考文献:A density-based algorithm for discovering clusters in large spatial database)。该算法能够有效处理噪声点和发现任意形状的空间聚类,与k-means聚类算法相比,不需要输入要划分的聚类个数。

二、相关概念

要理解DBSCAN算法,首先要清楚以下相关概念:

定义1:(e-领域) :点p的e-邻域记作:
在这里插入图片描述
即:以p为圆心,e为半径的范围里,所有的点q的集合。

定义2:(直接密度可达):如果:
(1)点p在点q的e-领域内
(2)在点q的e-领域内,至少包含MinPts个点
那么点p由点q直接密度可达,满足第2个条件的点q,被称为核心点(core point)。

定义3:(边界点):边界点(border point)不是核心点,因为它不满足其e-邻域内,至少包含MinPts个点,但边界点在其他核心点的e-邻域内。

定义4:(密度可达࿰

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值