1.关联规则
关联规则分析也称购物篮分析,用于发现事物之间的间接联系。比如,通过观察发现,在一个商店里,购买了面包的顾客大多同时会购买牛奶,则面包对应牛奶可以是一个规则({面包}=>{牛奶})
2.Aprior算法
Aprior算法是关联规则的最常用也是最经典的挖掘频繁项集的算法。其核心思想是通过连接产生候选项与其支持度然后通过剪枝生成频繁项集。
2.1 相关定义
2.1.1 项集
项集——项的集合,k项集——包含k个项的项集,例如集合{牛奶,麦片,糖}是一个3项集。
2.1.2 支持度和置信度
关联规则的支持度——项集A、B同时发生的概率:
Support(A=>B)=P(A U B)
关联规则的置信度——项集A发生&