8.3 凝聚层次聚类
凝聚的;分裂的
8.3.1 基本凝聚层次聚类算法
从个体点开始,相继合并两个最接近的簇,直到只剩一个簇。
1.定义簇之间的邻近性
2.时间和空间复杂度
8.3.2 特殊技术
1.样本数据
2.单链MIN
3.全链MAX或团
4.组平均
5.Ward方法和质心方法
Ward方法:两个簇的邻近度定义为两个簇合并导致的平方误差的增量
8.3.3 簇邻近度的Lance-Williams公式
新簇R与原簇Q的邻近度是Q与原来的簇A和B的邻近度的线性函数。
8.3.4 层次聚类的主要问题
1.缺乏全局目标函数
2.处理不同大小簇的能力
3.合并簇是最终的