网格聚类算法综述

1STING

STINGStatistical Information Grid)是一种基于网格的多分辨率聚类技术它将空间区域划分为矩型单元。针对不同级别的分辨率,通常存在多个级别的矩形单元,这些单元形成了一个层次结构;高层的每个单元被划分为多个低一层的单元。每个网格单元属性的统计信息(例如平均值、最大值和最小值)被预先计算和存储。这些统计信息对于下面描述的查询处理是有用的。

STING有几个优点:(1)由于存储在每个单元中的统计信息提供了单元中的数据不依赖查询的汇总信息,因此基于网格的计算是独立于查询的。(2)网格结构有利于并行处理和增量更新。(3)效率很高。STING扫描数据库一次来计算单元的统计信息。因此产生聚类的时间复杂度是O(n)n是对象的数目。n是对象的数目。在层次结构建立后,查询处理时间是O(g),这里g是最底层网格单元的数目,通常远远小于n

2Wave Cluster

Wave Cluster是一种多分辨率的聚类算法,它首先通过在数据空间上强加一个多为网格结构来汇总数据,然后采用一种小波变换来变换原特征空间,在变换后的空间中找到密集区域。在该方法中,每个网格单元汇总了一组映射到该单元中的点的信息。这种汇总信息适合于在内存中进行多分辨率小波变换时以及随后的聚类分析使用。

小波变换是一种信号处理技术,它将一个信号分解为不同频率的子波段。通过应用一维小波变换n次,小波模型可以应用于n