什么是关联规则挖掘?
关联规则挖掘或者关联分析,最早是为了进行购物篮分析而提出的。
关联规则挖掘的动机是什么?
找出数据中存在的规则。
比如:
1、被同时购买的产品
面包和牛奶,啤酒与尿布,可乐与薯片。
2、购买一种产品之后,购买界面的推荐
给推荐浏览此商品的顾客,同时浏览的商品;
推荐购买此商品的顾客也同时购买的商品。
频繁模式与关联规则
- 关联规则是基于市场的问题,对海量数据进行分析,获得有规律的结果。
- 频繁项集,产生于顾客浏览的数据;关联规则,产生于顾客发生交易行为的数据。
- 频繁项集中,产品之间是没有先后顺序,或者因果关系的;而关联规则中,产品之间涉及时间的先后,是存在顺序的。
- 关联规则在交叉营销和商场布局方面提供辅助决策。比如,应用于商场布局,1、把🥛与🍞放在一起,目的是增加同时购买🥛与🍞的可能性;2、🍞放在与🥛有一定距离的地方,目的是吸引买🍞/买🥛的顾客看看超市其他的商品。
关联规则的挖掘步骤
Step1 发现所有的频繁项集
Step2 从频繁项集中发现关联规则
频繁项集的挖掘方法
1、Apriori逐层发现算法
2、FP-growth(Freq.pattern growth)无候选集发现算法
3、Vertical data format approach
4、High dimensional dataset