数据挖掘怎么做关联性分析呢?

大家打开某宝,会发现,购物网站越来越懂我们了,推荐的商品正好就是我们想买的。其实这里面用到了数据挖掘中的关联规则,是典型的应用。类似应用还有很多,例如:资讯类APP的推荐(今日头条);微博推荐等。

接下来我们以购物篮这个典型的应用来为大家介绍,在购物场景下,是如何做关联分析,并帮助购物者更快速买到自己想要的东西。

全文讲解中所用到的产品是由亿信华辰提供的数据挖掘平台豌豆DM。

整个过程分为以下几个步骤:

应用目标:从订单数据集中找出关联度较高的商品。

创建数据集

下图的数据集为某商城的订单数据集(1000条订单号,20个商品类别)。

数据探索

首先通过豌豆DM提供的数据探索功能,查看数据是否存在缺失值,如果缺失应通过数据预处理功能,剔除缺失的数据。通过数据探索发现,该数据集的完整性较好,不需要做数据预处理。

构建模型

然后创建关联规则的挖掘过程,选择FP-Growth或Apriori算法来训练模型,得到我们需要的关联规则。下图例子中,我们认为支持度大于10%,可信度大于60%的规则,是客户经常同时购买的商品。如客户经常就会将喜力啤酒、苏打、饼干一起购买。

这便是商城当发现你购买了啤酒或苏打,会推荐你购买饼干的原因。

得到关联规则模型结果后,我们可以发布该模型到模型库,以供后续模型应用使用。

模型应用

最后在模型应用界面,我们只需简单的拖拽,即可完成模型应用的制作。模型应用以表格和推荐图的形式,展现了推荐商品的规则。当关联规则较多的时候,我们也可以通过筛选输入商品的参数,快速查询该商品的推荐规则。

 

从上图我们发现:

当购物者购买了牛油果和洋姜时,系统会自动为他推荐喜力啤酒;购买橄榄和腌牛肉,系统会自动推荐胶鲜鱼,省去了购物者搜索的操作,提高了购物网站的销量。

这就是豌豆DM关联分析应用的魅力所在,让不知不觉中为用户提供了很大的便利。

©️2020 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页