1 关联规则产生
关联规则反应的是一个事物与其他事物之间的关联关系,被称为购物篮模型,最初产生为啤酒喝尿布的故事。电商网站多用于商品推荐、联合发券、品类联合促销等方面。
2 关联规则指标
1)支持度为事物在数据集中发生的概率,支持度的意义在于度量项集在整个事务集中出现的频次,我们希望关注频次高的项集。
Support(A)=A/U
2)置信度,在A发生的条件下B发生的概率
Confidence(A-->B)=P(AB)/P(A)
3)提升度
Lift(A→B) = P(B|A) / P(B)=P(AB)/P(A)P(B)、
4)频繁项集:经常一起出现的项集
3 关联规则 ----Apriori算法原理
假设交易记录
item1 | A | B | C | D |
item2 | B | C | D | |
item3 | C | D | ||
item4 | B | F | G | H |
item5 | A | C | D |