基础算法--DBSCAN算法

DBSCAN是一种基于密度的空间聚类算法,通过核心对象、E邻域和密度可达的概念进行聚类。它不依赖于先验知识的类别数量,能发现任意形状的簇。在参数设置上,`eps`表示邻域距离阈值,`min_samples`表示成为核心对象所需的邻域内点数。算法通常使用欧氏距离,但支持多种距离度量。在大规模数据集上,可以选择使用KD树或球树加速计算。
摘要由CSDN通过智能技术生成

DBSCAN算法原理

DBSCAN算法概述

概念

在这里插入图片描述

名词含义

在这里插入图片描述

1、2核心对象和E邻域:某个点A,在半径E内的密度达到算法的阈值,则A点是核心对象。
3、4直接密度可达和密度可达:A点和B点、B点和C点是直接密度可达;A点和C点是密度可达。
在这里插入图片描述

5边界点:如图中的B、C,如名字的直接含义
6离群点:如图中的N,如名字的直接含义

算法工作原理

在这里插入图片描述

假设密度阈值为4。
第一步点A半径为E的区域内有4个点达到了阈值。
第二步:以A点周边的点为对象,半径为E的区域画圆,有核心对象DEF密度阈值都达到了4。
第三步:DEF为圆心,半径为E继续画圆,如果达到阈值就继续画圆,不断向外扩张,直到未达到阈值的BC边界点就停止。

在这里插入图片描述

DBSCAN聚类流程可视化展示

eps:半径
minPoints:圆内最少点数,即阈值
初始点随机选取

DBSCAN中API参数详解

class sklearn.cluster.DBSCAN(eps=0.5, min_sample

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值