机器学习案例|利用菜篮子分析法整合产品联系,玩转现代营销

01、案例说明

这个案例是一个非常典型的非监督性学习,也就是大家所熟悉的菜篮子分析。我们通过对于客户的购买记录,能够整合其间产品的关系,了解哪些产品之间有共同购买的可能性。整体模型如下图所示:

图片

02、数据资料

数据的形式是一个在实际生活中常见的状态,而不是以最理想可以分析的状态呈现,所以首先要做的事情仍然是将产品之间的关系,能够很清楚的定义出来,而作为一个组合购买,必须要以付款通知(Invoice)作为数据的结合点。

通常对于非监督性的学习,在数据观察主要是在于它的质量,而其中的互相关联性通常并不具有显著的意义,所以在这里观察是只需要确定没有必要数据的缺失就可以。

03、操作流程

Step1读入数据

这个部分直接将数据导入,并没有特别的目的。

Step2 数据整理

首先要将数据做一个整合,将在同一个付款通知数据的产品全部集合在一起。我们在这边使用的Aggregate算子,将数据重新整合,其中是使用整合这个功能,如下图所示:

图片

之后因为这个算子会将新整合的数据放入一个新的属性Concat(Product1),所以将其改名字之后,并且将Invoice作为ID属性,告诉系统不需对其进行任何的处理。

可以在这个地方设定一个停止点,而来观察其改变之后的数据。因为将数据整合,所以数量从原来的784个减低到493个,而其中的产品属性也变成一个多项式的产品,而其中用特殊符号分开。

Step3: 模型建立

这里边用了一个FP-Growth的算子,计算每一个产品和其相关的其他产品之间的发生频率,并且将其最小的支持数值(Support)设置为0.005,任何组合的支持数值小于这个组合之下,都不予以计算。如此系统可以快速的找出所有相关的产品组合。

另外一个特点,对于非监督性学习,因为没有已知的数据,所以没有办法测量其模型的准确度。这个也是与监督学习所不同的地方。

Step4: 模型表现

除了使用列表式的方式,可以看出产品之间相关联的程度。同样也可以用图形的方法,表示出互相之间的关系,所以我们使用这个Create AssociationRule的算子可以直接很直观地看到不同产品之间相互的关系。

04、结果说明

下图是表现产品之间关系的方式,第一个图FP-Growth是对于不同产品之间的组合依照支持数值来作排序。可以清楚地看到支持数字如果在0.005之下,就不再列出,详细的如下图所示:

图片

下面这个图,是表现出产品之间互相关联的方式,使用图形的方法可以更直观地看出相互之间的关系。而对于不同的产品,当鼠标移到产品上方时,自动展示所有相关的信息包括支持数值、信心度、以及其他参数,详细的如下图所示:

图片

对于电商或是其他的产品推荐平台,通过这个方法可以更有效地掌握产品之间相互的关系,而进行交叉销售(Up-selling),提升单客的销售金额。这个功能在产品的数量并不是很多时,可以很容易地观察到其间的关系,但是如果产品数量是成百上千,使用肉眼是没有办法快速地得到结论。通过这个方法,虽然在计算上面并不是特别的高深,但是能够快速有效的得到希望的结果,这个也是机器学习的优势。

另外一个常常使用的场景就是对于文字分析。分析大量的文章,可以对于某些敏感词和另外一些关键字之间的关系,可以通过这种方法进行分析。可以帮助更快速的找到特殊的关系而成为有效的商机。比如说在产品开发时,可以看出某些关键字和另外的一些特殊的热点词句之间的关系,而能掌握大部分人对于这些产品的关注点。


关于 Altair RapidMiner

Altair RapidMiner 数据分析与人工智能平台,是 Altair 澳汰尔公司旗下仿真、HPC 和数据分析三块主营业务中的解决方案,它在数据分析领域最早实现将自动化数据科学、文本分析、自动特征工程和深度学习等多种功能同时集成的一站式数据分析平台,帮助用户解决从数据清洗、准备、数据科学建模到模型管理和部署,同时又支持数据和流数据的实时分析可视化的数据分析平台。

欲了解更多信息,欢迎关注公众号:Altair RapidMiner

  • 11
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值