DBSCAN算法是一种基于密度聚类算法:
- 聚类的时候不需要预先指定簇的个数
- 最终簇的个数不一定
DBSCAN算法将数据点分为三类:
- 核心点:在半斤EPS内含有超过MinPts数目的点
- 边界点:在半斤EPS内点的数量小于MinPts,但是落在核心点的领域内
算法流程:
1. 对所有点计算其领域Eps=distance内的点的集合
2. 集合内的点个数超过MinPt3=count的点为核心点
3. 查看剩余点是否在核心点的领域内,若在则为边界点,否则为噪声点
import numpy as np
import sklearn.cluster