DBSCAN基本概念
DBSCAN(Density-Based Spatial Clustering of Applications with Noise)一是一种基于高密度连通区域的基于密度的聚类方法,DBSCAN算法将足够高密度的那部分区域划分为簇,并可以在带有”噪声”的空间数据库中发现任意形状的聚类。它定义簇为密度连通的点的最大集合。DBSCAN使用了两个参数:半径eps和密度阈值Minpts。DBSCAN需要由用户主观来选择参数,参数的选择决定了最终的聚类结果。在计算复杂度方面,如果采用空间索引,DBSCAN的计算复杂度是O(nlog(n)),其中n是对象数,否则计算复杂度为O(n2)。中用到以下定义。