关联规则

关联规则挖掘的 3 个度量指标:支持度、置信度、提升度
支持度(Support)
X → Y 的支持度表示{X,Y} 在总项集中出现的概率
形象点说:就是购买了X同时购买了Y的记录占所有记录的概率
置信度(Confidence)
X → Y 的置信度表示在先决条件 X 发生的情况下,由规则 X → Y 推出 Y 的概率。
形象点说:就是已知购买了X,还可能再购买Y的概率
提升度(Lift)
X → Y 的提升度表示含有X的条件下,同时含有Y的概率,与Y总体发生的概率之比。
简单来说就是 P(Y|X)/P(Y)
Lift(X→Y) > 1 的 X→Y 是有效的强关联规则,说明X有利于促进Y的购买
Lift(X→Y) <=1 的 X→Y 是无效的强关联规则
特别地,Lift(X→Y) = 1 时,X 与 Y 相互独立。
判断规则的有效性
问题:已知有1000名顾客买年货,分为甲乙两组,每组各500人,其中甲组有500人买了茶叶,同时又有450人买了咖啡;乙组有450人买了咖啡,如表所示,请问“茶叶→咖啡”是一条有效的关联规则吗?
“茶叶→咖啡”的支持度:Support(X→Y) = 450 / 1000 = 45%
“茶叶→咖啡”的置信度:Confidence(X→Y) = 450 / 500 = 90%
“茶叶→咖啡”的提升度:Lift(X→Y) = 90% / 90% = 1
由于提升度 Lift(X→Y) = 1,表示 X 与 Y 相互独立。也就是说,是否购买咖啡,与是否购买茶叶无关联。规则“茶叶→咖啡”不成立,或者说几乎没有关联,虽然它的置信度高达90%,但它不是一条有效的关联规则。

  • 2
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值