一、聚类算法的分类
-
层次聚类
-
划分聚类:图论、Kmean
-
基于密度:DBSCAN
-
基于网格
层次聚类
通过计算不同类别数据节点间的相似度来创建一颗有层次的嵌套树(聚类树)。
创建方法:自下而上合并,自上而下分裂。
合并算法
通过计算两类数据点间的相似性,组合最相似的两类,并反复迭代。
相似性由一个类别点与所有点之间的距离来确定。
距离越小,相似度越高。
相似度确定方法:
- Single Linkage:两点集(类)间距离最近的两点间距,做作为点集(类)间距离。容易受极端值影响。
- Complete Linkage:两点集间距离最远的两点间距,作为点集间距离。易受极端值影响。
- Average Linkage:两点集间所有点间距离的均值,作为点集间距离。计算量大。