多层关联规则
- 数据项中经常会形成概念分层
- 底层的数据项,其支持度往往也较低
- 在适当的等级挖掘出来的数据项之间的关联规则可能是非常有用的
- 通常, 事务数据库中的数据也是根据维和概念分层进行储存的
- 在多个抽象层挖掘关联规则, 并在不同的抽象层进行转化. 是数据挖掘系统应该提供的能力
挖掘多层关联规则的方法
一直支持度vs递减支持度
- 一直支持度: 对所有层都是用以致最小支持度
- 优点: 搜索时容易采用优化策略, 即一个项如果不满足最小支持度, 他的所有子项都可以不用搜索
- 缺点: 最小支持度值设置困难
-
- 太高: 将丢带出现在较低抽象层中有意义的关联规则
- -太低: 会在叫高层产生太多的无兴趣规则
- 递减支持度:在较低层使用递减的最小支持度
- -抽象层越低, 对应的最小支持度越小
搜索策略
- 具有递减支持度的多层关联规则的3种搜索策略
- 逐层独立: 完全的宽度(广度)搜索, 没有频繁项集的背景知识用于剪枝
- 层交叉单项过滤: 一个第i层的项被考察, 当且仅当它在第(i-1)层的父节点是频繁的
- 层交叉k项集过滤: 一个第i层的k项集被考察, 当且仅当它在第(i-1)层的对应父节点k-项集是频繁的()