DBSCAN算法(Density-Based Spatial Clustering of Application
with Noise)密度聚类算法
基于密度的聚类算法,K-means和层次聚类对于球状的簇聚类效果很好,DBSCAN可以用于更多复杂形状簇的聚类。
R中实现DBSCAN算法的API
“fpc”包
install.packages(“fpc”)
dbscan(data,eps,MinPts)
- data 样本数据 eps
- 领域的大小,使用圆的半径表示
- Minpts 领域内,点的个数的阈值
理解概念:
密度(Density)
空间中任意一点的密度是以该点为圆心,以EPS为半径的圆区域内包含的点数目
N的密度为1,B、C的密度为2,A的密度为4
邻域(Neighborhood)
空间中任意一点的邻域是以该点为圆心、以EPS为半径的圆区域内包含的点集合
核心点(Core Points)
空间中某一点的密度,如果大于某一给定阈值MinPts,则称该点为核心点
设MinPts为3,则核心点为A
边界点(Border Points)
空间中某一点的密度>1并且小于MinPts
图中的边界点为B、C
噪声点(Noise Points)
数据集中不属