目录
1、分层聚类算法
层次聚类算法又称为树聚类算法,它根据数据之间的距离,透过一种层次架构方式,反复将数据
进行聚合,创建一个层次以分解给定的数据集。
2、方法
01 聚类方法
linkage=scipy.cluster.hierarchy.linkage(data,method='single')
data 训练样本
method 类距离的计算公式:
1、single l两个类之间最短距离的点的距离
2、complete 两个类之间最长距离的点的距离
3、centroid 两个所有点的中点的距离
02 层次聚类绘图
scipy.cluster.hierarchy.dendrogram(linkage)
linkage 层次聚类的结果
03 层次聚类分类方法
scipy.cluster.hierarchy.fcluster(linkage,n,criterion='maxclust')
linkage 层次聚类的结果
n 要聚类的个数
criterion 划分方法,使用maxclust,最大划分法
3、分析步骤
01 计算每两个点距离的平方
计算公式:也就是两个点距