DBSCAN算法原理
DBSCAN算法概述
概念
名词含义
1、2核心对象和E邻域:某个点A,在半径E内的密度达到算法的阈值,则A点是核心对象。
3、4直接密度可达和密度可达:A点和B点、B点和C点是直接密度可达;A点和C点是密度可达。
5边界点:如图中的B、C,如名字的直接含义
6离群点:如图中的N,如名字的直接含义
算法工作原理
假设密度阈值为4。
第一步点A半径为E的区域内有4个点达到了阈值。
第二步:以A点周边的点为对象,半径为E的区域画圆,有核心对象DEF密度阈值都达到了4。
第三步:DEF为圆心,半径为E继续画圆,如果达到阈值就继续画圆,不断向外扩张,直到未达到阈值的BC边界点就停止。
DBSCAN聚类流程可视化展示
eps:半径
minPoints:圆内最少点数,即阈值
初始点随机选取
DBSCAN中API参数详解
class sklearn.cluster.DBSCAN(eps=0.5, min_sample