7.3.1 关联规则的元规则制导挖掘
元规则的作用是什么?
元规则使得用户可以说明他们感兴趣的规则的语法形式。规则的形式可以作为约束,帮助提高
挖掘的性能。也是说,它挖掘一种规则的形式(或者说,属性的组合模式而不是这种组合本身。)
那么如何使用元规则指导挖掘过程呢?
首先元规则的模板:
P1&&P2&&…Pl=>Q1&&Q2&&…Qr
所以元规则的谓词的总数是(l+r),为了找出满足这个模板的维间关联规则:需要注意下面两点:
- 需要找出所有的频繁p-谓词集 Lp。
- 还需要Lp中的l-谓词集的支持度计数,方便计算Lp导出的规则的置信度。
7.3.2 在挖掘期间对搜索空间剪枝的办法是?
- 模式搜索空间剪枝
- 数据搜索空间剪枝
模式空间剪枝约束
- 单调的
- 反单调的
- 简洁的约束
- 可转变的约束
- 不可转变的约束
什么是反单调的模式剪枝约束?
如果一个项集不满足该规则约束,那么它的任何超集也不满足该规则约束。
eg:
min(J.price)>=50,一旦存在一个项集中有小于50的价格,那么它的所有超集都不满则
这个约束了。
count(I)<=10 等等都是如此。
数据空间剪枝约束
策略是什么?
减掉对其后挖掘过程中可满足模式的产生没有贡献的数据片段。
两个性质:
- 数据的简洁性
- 数据的反单调性
什么是数据的反单调性?
在挖掘过程中,如果基于当前模式,一个数据项不满足数据反单调性约束,则可以减掉它。
我们剪掉它,因为在剩下的挖掘过程中,它不能对当前模式的超模式的产生有任何形式的贡献。
因此,我们说,数据反单调性对搜索空间剪枝仅限于基于模式增长的挖掘算法。