1. AGNES
AGNES是一种采用自底向上合并策略的聚类算法,其思想为:初始将所有样本看成一个簇,然后在每一轮过程中将距离最近的两个簇合并为一个簇,簇的个数不断减少到人为指定的聚类簇数K,终止算法。该算法关键在于如何度量两个簇的距离,集合间的距离计算有如下方式:
最 小 距 离 : d i s t ( C i , C j ) = m i n [ x ∈ C i , z ∈ C j ] ∣ ∣ x − z ∣ ∣ 2 最 大 距 离 : d i s t ( C i , C j ) = m a x [ x ∈ C i , z ∈ C j ] ∣ ∣ x − z ∣ ∣ 2 平 均 距 离 : d i s t ( C i , C j ) = 1 ∣ C i ∣ ∣ C j ∣ ∑ x ∈ C i ∑ z ∈ C j ∣ ∣ x − z ∣ ∣ 2 \begin{aligned} 最小距离:dist(C_i,C_j) &= min_{[x\in C_i,z\in C_j]}||x-z||_2 \\ 最大距离:dist(C_i,C_j) &= max_{[x\in C_i,z\in C_j]}||x-z||_2 \\ 平均距离:dist(C_i,C_j)&=\cfrac{1}{|C_i||C_j|}\sum_{x\in C_i}\sum_{z\in C_j}||x-z||_2 \end{aligned} 最小距离:dist(Ci,Cj)最大距离:dist(Ci,Cj)平均距离:dist(Ci,Cj)=min[x∈Ci,z∈Cj]∣∣x−z∣∣2=max