1:划分方法:只有一层,把n个对象的集合划分为k个分区,k<=n
k-均值 和 k-中心点算法,这些属于启发式聚类方法,适合于发现中小型的数据库中的球状互斥簇
2:层次方法:将数据库划分并分层
分为 凝聚 和分裂方法:
凝聚:把一个对象当成一个组,与最相近的那个对象组合成一个簇,之后迭代,直到所有的对象在一个簇里面或者达到停止条件而停止。因此也被称为自底向上的方法
分裂:把所有的对象放在一个簇里面,每次迭代之后,一个簇被分裂成几个小簇,直到每个对象一个簇为止或者簇内的对象彼此度充分相似。因此也被称为 自顶向下的方法
层次方法的缺陷:一旦一个步骤(凝聚或分裂)完成,就不能够撤销
3:基于密度的方法:
只要邻域中的点的密度(点的数目)超过某一个阀值,就继续增长给定的簇,这样的方法可以产生任意形状的簇。并且可以过滤噪声或离群点
4:基于网格的方法:
把对象空间量化为有限个单元形成一个网格结构。此方法可以与其他方法进行集成,处理速度快,独立于数据,但是依赖于网格大小