基于距离的聚类算法,如K-Means算法。
基于密度的聚类算法主要的目标是寻找被低密度区域分离的高密度区域。
与基于距离的聚类算法不同的是,基于距离的聚类算法的聚类结果是球状的簇,而基于密度的聚类算法可以发现任意形状的聚类,这对于带有噪音点的数据起着重要的作用。
DBSCAN(Density-Based Spatial Clustering of Application with Noise
,具有噪声的基于密度的聚类方法
)
经典密度聚类算法
将数据点分为以下三类:
- 核心点。在半径Eps内含有超过MinPts数目的点
- 边界点。在半径Eps内点的数量小于MinPts,但是落在核心点的邻域内
- 噪音点。既不是核心点也不是边界点的点