k-means聚类算法:
k为手动设定的k个中心点(质点),means为平均值,即中心点附近的所有点的平均值。
原理:随机产生设定的K个中心点,所有点找最近的中心点,构成k个集群点。取集群内的各点到所属于的中心点的距离取平均值,得到最新的中心点,迭代至所有中心点与上一次得到的中心点位置不再变化或者微小变化,停止迭代。得到最终的聚类集群。
k-中心点算法:
k为手动设定的k个中心点(质点),在每一类中依次取所有点到某一点的距离最近,为新的中心点。
层次聚类:
有多少个点就分多少类,然后距离较近的类合并成一类,然后逐渐合并成一个大类,最终根据自己的需求分成若干类。
模糊聚类:
对于一个数据模棱两可,可能是a类也可能是b类,a类的可能为40%,b类的可能是60%。
DBCSAN
密度算法,其核心思想就是先发现密度较高的点,然后把相近的高密度点逐步都连成一片,进而生成各种簇。算法实现上就是,对每个数据点为圆心,以eps为半径画个圈(称为邻域eps-neigbourhood),然后数有多少个点在这个圈内,这个数就是该点密度值。然后我们可以选取一个