Density-based methods:
DBSCAN中的几个定义:
E邻域:给定对象半径为E内的区域称为该对象的E邻域
核心对象:如果给定对象E邻域内的样本点数大于等于MinPts,则称该对象为核心对象
直接密度可达:对于样本集合D,如果样本点q在p的E邻域内,并且p为核心对象,那么对象q从对象p直接密度可达
密度可达:对于样本集合D,给定一串样本点p1,p2,p3,...pn, p=p1, q=pn,假如对象pi从pi-1直接密度可达,那么对象q从对象p密度可达。注意:密度可达是单向的,密度可达即可容纳同一类。
密度相连:存在样本集合D中的一点o,如果对象o到对象p和对象q都是密度可达的,那么p和q密度相连。
密度可达是直接密度可达的传递闭包,并且这种关系是非对称的。密度相连是对称关系。DBSCAN目的是找到密度相连对象的最大集合。