K-means需要做多组(取平均,设置k值) DBSCAN 寻找核心对象:某个点以r(人为给予)为邻域半径画圈,如果该领域内点的数量不小于Min-pts(人为给予)则认为该点为核心对象 半径选择:计算K距离找到突变点 Minist:尽可能让它小(4 or 5) -1簇内即为离群点 以某实际小型数据集为例进行demo # beer dataset import pandas as pd beer = pd.read_csv('data.txt', sep=' ') beer