强关联规则是否都是有趣的?

挖掘了关联规则后,哪些规则是用户感兴趣的?强关联规则是否就是有趣的?

我们从下面的例子中来了解强关联规则到底是怎么一回事。

 买游戏不买游戏合计
买录像400035007500
不买录像20005002500
合计6000400010000

由上表可以得出:buys(X,"computer games")=>buys(X,"videos")[40%,66.7%](这是一个相当强的关联规则,但却不是一个正确的关联规则)

但其实全部人口中购买录像带的人数是75%,比66.7%多;事实上购买了电子游戏之后大家都不愿意买录像带了,这就是为什么买了电子游戏之后,买录像带的概率下降的原因。这里录像带和游戏是负相关的。(如果我们单纯的根据我们挖掘的结果,则我们就会得出买了电子游戏之后,人们还倾向于购买录像带。这刚好和实际相反)

可见A=》B的置信度有欺骗性,它只是给出A,B条件概率的估计,而不度量A,B间蕴含的实际强度

我们怎么才能正确的计算A,B之间的相关性呢?

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值