之前写过一篇关于商品联合销售的文章,借助于apriori算法做关联分析,成功地从订单数据中挖掘到类似于“啤酒——尿布”的频繁模式。
现在我们就来解决另一个问题:定位商品组合的目标客户,即为“啤酒—尿布”寻找对应的“奶爸群体”,以实现个性化推荐。
案例来自IBM SPSS Modeler官网,包括两份数据,订单数据+用户属性数据。模型为决策树,通过C5.0 规则归纳,描绘已标识产品组的购买者的特征。实验环境为modeler。
-
数据介绍
这是经过匹配的订单数据和用户属性数据,共有18个字段。前7个字段用于描述客户的个人信息,后11个字段表示对这些类别的商品的购买情况。
-
通过apriori算法建立关联规则
具体可参考之前提到的文章,这里直接给出描述商品关联关系的网状图。
第一张图比较密,显示的是全部商品的关联关系,第二张图是通过条件约束,提取到的最最相关的少数几条关联规则,分别是:鱼和果蔬;酒和粮果;啤酒、冻肉和罐装蔬菜,意味着这几种商品最可能被同时购买。
-
通过C5.0描绘目标客户群的特征
根据上一步的结果,分别标识三种商品组合对应的客户,再结合他们的个人基本信息,使用规则归纳 (C5.0) 来描绘各自目标客户群的特征。
也就是说,对三类商品组合,要做3次决策树建模,得到的结果如下:
-
应用
经过前面的分析,我们找到了三条类似于“啤酒-尿布”的频繁模式,并定位到对应的“奶爸群体”,接下来可考虑制定如下销售策略。