关联规则可视化

关联规则挖掘是一种流行的数据挖掘方法,在R语言中为扩展包arules。然而,挖掘关联规则往往导致非常多的规则,使分析师需要通过查询所有的规则才能发现有趣的规则。通过手动筛选大量的规则集是费时费力。在本文中,我们基于探索关联规则的R扩展包arulesViz,提出几个已知的和新颖的可视化技术。

1、简介

算法步骤这里不做详细介绍,下面是几个重要的变量的定义:

Supp(X=>Y) = P(X) Conf(X=>Y) = P(Y|X) Lift(X=>Y) = CONF(X=>Y)/SUPP(Y) = P(X and Y)/(P(X)P(Y))

(Lift)是避免了一些不平衡数据标签的偏差性, Lift越大,则数据质量较好;Lift越小,则数据越不平衡。

2、数据准备和arulesViz的统一接口

使用扩展包arulesViz之前,我们首先需要加载它。这个包会自动加载其他所需要的数据包,如arules。如下面的数据集Groceries包含在arules包里面。

> library("arulesViz") > data("Groceries") > summary(Groceries)

设置支持度为0.001,置信度为0.5,R语句入下:

> rules <- apriori(Groceries, parameter = list(support = 0.001, confidence = 0.5)) > rules set of 5668 rules

结果共找出了5668条规则。按照Lift降序排,最大的三条规则如下:

> inspect(head(sort(rules, by = "lift"), 3))  lhs rhs support confidence lift 1 {Instant food products,   soda} => {hamburger meat} 0.001220132 0.6315789 18.99565 2 {soda,   popcorn} => {salty snack} 0.001220132 0.6315789 16.69779 3 {flour,   baking powder} => {sugar} 0.001016777 0.5555556 16.40807

3、散点图

直接用plot画出散点图

> plot(rules)

  • 1
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值