6 DBSCAN 密度聚类算法
基于密度进行聚类,一种基于密度进行聚类的算法。
聚类的时候不需要预先指定簇的个数
最终的簇的个数不确定
DBSCAN算法将数据点分为三类:
核心点:在半径Eps内含有超过MinPts数目的点。
边界点:在半径Eps内点的数量小于MinPts,但是落在核心点的邻域内。
噪音点:既不是核心点,也不是边界点。
算法流程:
1.将所有点标记为核心点、边界点或噪声点;
2.删除噪声点;
3.为距离在Eps之内的所有核心点之间赋予一条边;
4.每组连通的核心点形成一个簇;
5.将每个边界点指派到一个与之关联的核心点的簇中(即看它在哪一个核心点的半径范围之内,那么它就属于该核心点所在的簇)。