一、层次聚类
首先考虑欧式空间下的层次聚类。该算法仅可用于规模相对较小的数据集。层次聚类用于非欧式空间时,还有一些与层次聚类相关的额外问题需要考虑。因此,当不存在簇质心或者说簇平均点时,可以考虑采用簇中心点(clustroid)来表示一个簇。
1.1 欧式空间下的层次聚类
首先,每个点看作一个簇,通过不断的合并小簇而形成大簇。我们需要提前确定
(1) 簇如何表示?
(2) 如何选择哪两个簇进行合并?
(3) 簇合并何时结束?
对于欧式空间,(1)通过簇质心或者簇内平均点来表示簇。对于单点的簇,该点就是簇质心。可以初始化簇数目为欧式空间点的数目Cnumber=n。簇之间的距离为质心之间的欧式距离,(2)选择具有最短距离(或者其他方式)的两