聚类算法:无监督学习,用来对数据对象进行分组,将相似的对象划分到同一个组或者类别中。聚类产生的类别标签是未知的,与分类不同。聚类是一种探索性数据分析方法,跟分类不同,聚类没有预测功能,是根据对象的不同属性所决定的距离来发现相似对象并划分为同一个分组。
一、聚类算法的种类
聚类算法:有多种聚类方法,可根据数据类型,目的及具体应用要求来选择合适的聚类算法
1.1 基于划分的聚类方法:
K-means 、Kmeans ++ 算法 (改进了K均值算法选择初始质心的方式。)
二分类K均值聚类算法 、小批量K均值算法、K中心算法、 数据流K均值算法
1.2基于密度的聚类方法: DBSCAN算法 、OPTICS算法
1.3基于模型的聚类方法: 高斯混合模型算法(GMM)
1.4基于层次的聚类方法(层次聚类)hierarchical clustering
凝聚的层次聚类AGglomerativeNESting), AGNES
自上向下的分裂方法(DIivisive ANAlysis),比如DIANA