1. 基本概念
关联规则挖掘是指寻找给定数据集中项之间的有趣关联或相关联系。可以帮助许多决策的制定,如分类设计、交叉购物和贱卖分析。典型的例子就是购物篮分析。
2. 关联规则的步骤
(1)找出所有的频繁项集:这些项集出现的频繁性至少和预定义的最小支持数一样
(2)由频繁项集产生强关联规则:这些规则必须满足最小支持度和最小置信度
3. 关联规则的分类
(1)根据规则中所处理的值类型:布尔关联规则(项的在与不在)和量化关联规则(量化的项或属性之间的关联);
(2)根据规则中涉及的数据维:单维关联规则和多维关联规则
(3)根据规则集中所涉及的抽象层:单层关联规则和多层关联规则
(4)根据关联挖掘的各种扩充:最大模式和频繁闭项集
4. 最简单形式的关联规则方法——Apriori算法
(1)定义:是一种最有影响的挖掘布尔关联规则频繁性集的算法
(2)性质:频繁项集的所有非空子集都必须也是频繁的
(3)原理&