模式压缩问题可以定义如下: 给定一个事务数据库,最小支持度min_sup和聚类质量度量西格玛,模式压缩问题是找到一个 代表模式的集合R,使得对于每一个P,存在一个Pr属于R,它覆盖了P,并且|R|是最小化的。 提取感知冗余的top-k模式??? 定义:不仅具有高显著性,而且具有低冗余的k个代表模式的小集合称为 __感知冗余__的top-模式。 感知冗余的top-k选择模式在高显著性和低冗余性之间进行平衡。