sklearn里层次聚类的参数及解释:
- n_clusters: 事先定义多少簇;如果distance_threshold不是none,则它必须被定义为none
- affinity(亲和力算法):用来计算联系程度的算法,它默认是‘euclidean’(欧式距离),还可以定义为’l1’,‘l2’, ‘mantattan’(曼哈顿距离), 如果linkage=‘ward’,affinity必须为‘euclidean’
- memory:用缓存来存储输出的结果,默认不缓存
- connectivity:一个数组或可调用对象,用来指定连接矩阵
- compute_full_tree:当训练了n_clusters后,训练过程停止,若compute_full_tree=True,则继续训练从而生成完整的数
- linkage:用来指定链接算法
– ‘ward’:单链接single-linkage, 采用dmin
– ‘complete’: 全链接complete-linkage,采用dmax
– ’average‘:均连接average-linkage算法,采用davg - distance_threshold: 超过一定的链接距离,则这个簇将不会被合并;如果它是非空,则n_clusters必须是none,且compute_full_tree必须是True