1.密度聚类的简单介绍:
常见的密度聚类包括DBSCAN聚类和密度最大值聚类等。本文主要讲的是DBSCAN聚类。DBSCAN聚类是一个比较有代表性的基于密度的聚类算法,与划分和层次聚类方法不同,它将簇定义为密度相连的点的最大集合,能够把具有足够高密度的区域划分为簇,并可在有“噪声”的数据中发现任意形状的聚类,而不局限于凸多边形的聚类,凹多边形同样可以聚类。
2.DBSCAN密度聚类的一些基本概念
对象的ε-临域:给定对象在半径ε内的区域。
核心对象:如果一个对象的ε-临域至少包含最小数目x个对象,则称该对象为核心对象。
直接密度可达:给定一个对象集合D,如果p是在q的ε-邻域内,而q是一个核心对象,我们说对象p从对象q出发是直接密度可达的。
如图ε=1cm,x=5,q是一个核心对象,从对象q出发到对象p是直接密度可达的
密度可达:如果存在一个对象链p1,p2,…,pn