用sklearn包进行DBSCAN的运算,其中有两个重要的参数如下:(具体的含义请参考别的博文)
1)eps:
越大类别数越少——参数越大的话,多个簇和大部分对象会归并到同一个簇中
2)min_samples:
MinPts(min_samples)的选取有一个指导性的原则,MinPts≥dim+1,其中dim表示待聚类数据的维度。MinPts设置为1是不合理的,因为设置为1,则每个独立点都是一个簇,MinPts≤2时,与层次距离最近邻域结果相同,因此,MinPts必须选择大于等于3的值。若该值选取过小,则稀疏簇中结果由于密度小于MinPts,从而被认为是边界点儿不被用于在类的进一步扩展;若该值过大,则密度较大的两个邻近簇可能被合并为同一簇。因此,该值是否设置适当会对聚类结果造成较大影响。
import matplotlib.pyplot as plt
from sklearn.cluster import DBSCAN
import numpy as np
输入:是一个narrary