【转载】关联分析中的支持度、置信度和提升度

目录

1. 支持度(Support)

2. 置信度 (Confidence)

3. 提升度(Lift)


1. 支持度(Support)

 支持度表示项集{X,Y}在总项集里出现的概率。公式为:

                                               Support(X→Y) = P(X,Y) / P(I) = P(X \cap Y) / P(I) = num(X \cap Y) / num(I)

 其中,I表示总事务集。num()表示求事务集里特定项集出现的次数。  

            比如,num(I)表示总事务集的个数;num(X \cap​​​​​​​ Y)表示含有{X,Y}的事务集的个数(个数也叫次数)。    

 

2. 置信度 (Confidence)

   置信度表示在先决条件X发生的情况下,由关联规则”X→Y“推出Y的概率。即在含有X的项集中,含有Y的可能性,公式为:

                                                  Confidence(X→Y) = P(Y|X)  = P(X,Y) / P(X) = P(X \cap​​​​​​​ Y) / P(X) 

                                                  Confidence(Y→X) = P(X|Y)  = P(X,Y) / P(Y) = P(X \cap​​​​​​​ Y) / P(Y) 

 

3. 提升度(Lift)

    提升度表示含有X的条件下,同时含有Y的概率,与Y总体发生的概率之比。

                                                                             Lift(X→Y) = P(Y|X) / P(Y)

注:提升度 = 置信度 / 支持度 (lift(X->Y)=confidence(X->Y) / support(Y)

 

     例1,已知有1000名顾客买年货,分为甲乙两组,每组各500人,其中甲组有500人买了茶叶,同时又有450人买了咖啡;乙组有450人买了咖啡,如表(1)所示:

                                                                                    表(1)年货购买表

      试求解 1)”茶叶→咖啡“的支持度

                   2) "茶叶→咖啡"的置信度

                   3)”茶叶→咖啡“的提升度

    分析:

         设X= {买茶叶},Y={买咖啡},则规则”茶叶→咖啡“表示”即买了茶叶,又买了咖啡“,于是,”茶叶→咖啡“的支持度为

               Support(X→Y) = 450 / 500 = 90%

        "茶叶→咖啡"的置信度为

               Confidence(X→Y) = 450 / 500 = 90%

          ”茶叶→咖啡“的提升度为

               Lift(X→Y) = Confidence(X→Y) / P(Y) = 90% /  ((450+450) / 1000) = 90% / 90% = 1

        由于提升度Lift(X→Y) =1,表示X与Y相互独立,即是否有X,对于Y的出现无影响。也就是说,是否购买咖啡,与有没有购买茶叶无关联。即规则”茶叶→咖啡“不成立,或者说关联性很小,几乎没有,虽然它的支持度和置信度都高达90%,但它不是一条有效的关联规则。

        满足最小支持度和最小置信度的规则,叫做“强关联规则”。然而,强关联规则里,也分有效的强关联规则和无效的强关联规则。

        如果Lift(X→Y)>1,则规则“X→Y”是有效的强关联规则。

        如果Lift(X→Y) <=1,则规则“X→Y”是无效的强关联规则。

        特别地,如果Lift(X→Y) =1,则表示X与Y相互独立。

 

参考链接:

https://blog.csdn.net/sanqima/article/details/42746419

https://blog.csdn.net/weixin_42057852/article/details/82661667

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值