Single Link 和 Complete Link 是层次聚类(Hierarchical Clustering)中的两种策略,分别用于定义簇之间的距离。在这段解释中,将详细阐述 Complete Link 的定义、作用,以及它与 Single Link 的区别及为什么选择最长距离可以避免长链(long chains)问题。
1. Single Link 和 Complete Link 的基本定义
Single Link(单链接)
-
定义:簇与簇之间的距离是两个簇中最近点之间的距离。
d s i n g l e ( C i , C j ) = min x ∈ C i , y ∈ C j d ( x , y ) d_{single}(C_i, C_j) = \min_{x \in C_i, y \in C_j} d(x, y) dsingle(Ci,Cj)=x∈C