DBSCAN聚类算法原理
基础
DBSCAND算法的全称是ensity-based spatial clustering of applications with noise (DBSCAN),从原理上讲,该算法属于OPTICS算法的一种特殊情况,而OPTICS算法就是DBSCAND算法的推广。
概念与定义
与OPTICS算法类似,DBSCAND算法的输入参数同样包括:半径 ε ,和最少点数 MinPts ;不同的是DBSCAND算法中有样本与样本直间分为直接(密度)可达与(密度)可达两种情况,定义分别如下:
- 直接(密度)可达:
P为核心点,那么其周围在半径 ε 内的点都是从P直接(密度)可达。
(密度)可达:
对于点Q,如果存在