层次聚类方法是对给定的数据集进行层次的分解,直到某种条件满足为止。一般来说,有两种类型的层次聚类方法:第一,凝聚层次聚类方法;第二,分裂层次聚类方法。其中DIANA算法是属于层次聚类方法。
一,DIANA算法属于分裂的层次聚类,与凝聚的层次算法(也就是AGNES),它采用一种自顶向下的策略,它首先将所有对象置于一个簇中,然后逐渐细分为越来越小的簇,直到每个对象自成一个簇,或者达到某个终结点,比如达到了某个希望的簇数目,或者两个最近簇之间的距离超过了某个阈值。
二,在DIANA方法的处理过程中,所有的对象初始值都放在一个簇中,根据某一些原则,将该簇进行分裂,簇的分类过程反复进行,直到最终每个新的簇只包含一个对象。
三,针对DIANA算法,我们举个例子来分析
表1 样本事务数据库
序号 | 属性1 | 属性2 |
---|---|---|
1 | 1 | 1 |
2 | 1 | 2 |
3 | 2 | 1 |
4 | 2 | 2 |
5 |