层次聚类算法又称为树聚类算法[8,9],它使用数据的联接规则,透过一种层次架构方式,反复将数据进行分
裂或聚合,以形成一个层次序列的聚类问题解.本文仅以层次聚类算法中的层次聚合算法为例进行介绍.层次聚
合算法的计算复杂性为O(n2),适合于小型数据集的分类.
2.1.1 层次聚合算法
该算法由树状结构的底部开始逐层向上进行聚合,假定样本集S={o1,o2,…,on}共有n 个样本.
HA1[初始化]. 置每个样本oi 为一个类; /*共形成n 个类:o1,o2,…,on*/
HA2[找最近的两个类]. ( , ) min , , ( , ) distance or ok ou ov S ou ov distance ou ov ∀ ∈ ≠ = ;
/*从现有的所有类中找出距离最近(相似度最大)的两个类or 和ok*/
HA3[合并or 和ok]. 将类or 和ok 合并成一个新类ork; /*现有的类数将减1*/
HA4. 若所有的样本都属于同一个类,则终止本算法;否则,返回步骤HA2.
层次聚类算法
最新推荐文章于 2023-12-28 07:00:00 发布