目录
密度聚类方法
密度聚类方法的核心思想是,只要样本点的密度大于某阈值,则将该样本添加到最近的簇中。这类算法可发现任意形状的聚类, 且对噪声数据不敏感。但密度单元的计算复杂度大,需要建立空间索引来降低计算量。
DBSCAN
DBSCAN(Density-Based Spatial Clustering of Applications with Noise),基于密度的带噪声的空间聚类的应用,一个比较有代表性的基于密度的聚类算法。 它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在有噪声的数据中发现任意形状的聚类。
DBSCAN算法的若干概念
- 对象的ε-邻域:给定对象在半径ε内的区域。
- 核心对象:对于给定的数目m,如果一个对象的ε-邻域至少包含m个对象,则称该对象为核心对象。
- 直接密度可达:如果对象