层次聚类
凝聚层次聚类
簇的距离的度量
最短距离(min)、最长距离(max)、平均距离、ward和质心距离
簇邻近度的Lance- Williams公式
其描述了将簇A和簇B合并形成簇C,对于给定的簇P,CP的距离可以用AB、AP、BP间距离的线性组合表示。这种现象对于上述介绍的所有邻近度度量适用,只是每项前的参数(𝑎1,𝑎2,𝑎3,𝑎4a1,a2,a3,a4)不同罢了(详见P326 表8-5)。这允许我们在更新邻近度矩阵时无需再从头进行运算,而是利用已知的邻近度矩阵进行迭代即可。
层次聚类的问题
1、缺乏全局目标函数:避开了解决困难的组合优化问题,很难选择初始点的问题。
2、合并是最终的:一旦合并就不能撤销。