【统计分析】关联规则之置信度,支持度,提升度

别看这几个公式不起眼,数据分析倒是用的很普遍,所以最好记住啊,记不住也没关系,我都总结好了

一般使用三个指标来度量一个关联规则,根据这三个指标可以筛选出满足条件的关联规则。
这三个指标是: S u p p o r t ( 支 持 度 ) Support(支持度) Support C o n f i d e n c e ( 置 信 度 ) Confidence(置信度) Confidence L i f t ( 提 升 度 ) Lift(提升度) Lift
X , Y X,Y XY这个关联规则为例来说明:
先验前提: X , Y X,Y XY表示为商品,现有一商场,统计一天内的订单小票。

1. Support(支持度):

表示同时购买 X 、 Y X、Y XY的订单数占总订单数(研究关联规则的“长表”中的所有购买的产品的订单数)的比例。如果用 P ( X ) P(X) P(X)表示购买 X X X的订单比例,其他产品类推,那么
S u p p o r t ( X , Y ) = P ( X , Y ) P ( A l l ) = 同 时 购 买 { X , Y } 的 订 单 数 总 订 单 数 Support(X,Y) = \frac{P(X,Y)}{P(All)}=\frac{同时购买\{X,Y\}的订单数}{总订单数} Support(X,Y)=P(All)P(X,Y)={X,Y}

2. Confidence(置信度)

表示购买 X X X的订单中同时购买 Y Y Y的比例,即同时购买 X X X Y Y Y的订单数占购买 X X X的订单的比例。公式表达:
C o n f i d e n c e ( X − > Y ) = P ( Y / X ) = P ( X , Y ) P ( X ) = 同 时 购 买 { X , Y } 的 订 单 数 购 买 X 的 订 单 数 Confidence(X->Y) =P(Y/X) =\frac{P(X,Y)}{P(X)}=\frac{同时购买\{X,Y\}的订单数}{购买X的订单数} Confidence(X>Y)=P(Y/X)=P(X)P(X,Y)=X{X,Y}

C o n f i d e n c e ( Y − > X ) = P ( X / Y ) = P ( X , Y ) P ( Y ) = 同 时 购 买 { X , Y } 的 订 单 数 购 买 Y 的 订 单 数 Confidence(Y->X) =P(X/Y) =\frac{P(X,Y)}{P(Y)}=\frac{同时购买\{X,Y\}的订单数}{购买Y的订单数} Confidence(Y>X)=P(X/Y)=P(Y)P(X,Y)=Y{X,Y}

3. Lift(提升度):

L i f t ( X − > Y ) = P ( X , Y ) P ( X ) P ( Y ) = P ( Y / X ) P ( Y ) = 同 时 购 买 { X , Y } 的 订 单 数 × 总 订 单 数 购 买 X 的 订 单 数 × 购 买 Y 的 订 单 数 Lift(X->Y) =\frac{P(X,Y)}{P(X)P(Y)} =\frac{P(Y/X)}{P(Y)}=\frac{同时购买\{X,Y\}的订单数\times总订单数}{购买X的订单数\times购买Y的订单数} Lift(X>Y)=P(X)P(Y)P(X,Y)=P(Y)P(Y/X)=X×Y{X,Y}×

  • 提升度反映了关联规则中的 X X X重点内容 Y Y Y的相关性;
  • 提升度 > 1 >1 >1 且越高表明正相关性越高;
  • 提升度 < 1 <1 <1 且越低表明负相关性越高;
  • 提升度 = 1 =1 =1 表明没有相关性。

计算代码见:https://github.com/geeklili/Association_Analysis

  • 14
    点赞
  • 55
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值