关联规则挖掘(下)

主要内容
关联规则分析概述
频繁项集、闭项集和关联规则
频繁项集挖掘方法
关联模式评估方法
Apriori算法应用
关联规则挖掘(上)
关联规则挖掘(下)

四、关联模式评估方法

大部分关联规则挖掘算法都使用支持度-置信度框架。尽管最小支持度和置信度阈值可以排除大量无趣规则的探查,但仍然会有一些用户不感兴趣的规则存在。当使用低支持度阈值挖掘或挖掘长模式时,这种情况尤为严重。

强关联规则不一定是有趣的

在这里插入图片描述
从关联分析到相关分析

由于支持度和置信度还不足以过滤掉无趣的关联规则,因此,可以使用相关性度量来扩展关联规则的支持度-置信度框架。相关规则框架为:
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

五、Apriori算法应用

在Pyhton中进行关联规则挖掘时需要用到apyori包,apyori包的安装方式为:

pip install apyori

首先导入相关包和数据

import pandas as pd
from apyori import apriori  # pip install apriori
df = pd.read_excel("data.xls")
df.head()

在这里插入图片描述
获取项集

transactions = df.groupby(by = 'OrderID').apply(lambda x:list(x.CategoryName))
transactions.head(6)

# OrderID
# 10248    [Dairy Products, Grains/Cereals, Dairy Products]
# 10249                                  [Produce, Produce]
# 10250                      [Seafood, Produce, Condiments]
# 10251        [Grains/Cereals, Grains/Cereals, Condiments]
# 10252       [Confections, Dairy Products, Dairy Products]
# 10253            [Dairy Products, Beverages, Confections]
# dtype: object

进行关联规则挖掘

min_supp = 0.1
min_conf = 0.1
min_lift = 0.1
result = list(apriori(transactions=transactions,min_support=min_supp,min_confidence=min_conf,min_lift=min_lift))
result

在这里插入图片描述

返回结果result中的属性说明:
(1)items – 项集,frozenset对象,可迭代取出子集;
(2)support – 支持度,float类型;
(3)confidence – 置信度或可信度,float类型;
(4)ordered_statistics – 存在的关联规则,可迭代,迭代后,其元素的属性:
· items_base – 关联规则中的分母项集;
· confidence – 上面的分母规则所对应的关联规则的可信度。

显示挖掘的关联规则

supports=[]
confidences=[]
lifts=[]
bases=[]
adds=[]
for r in result:
    for x in r.ordered_statistics:
        supports.append(r.support)
        confidences.append(x.confidence)
        lifts.append(x.lift)
        bases.append(list(x.items_base))
        adds.append(list(x.items_add))
resultshow = pd.DataFrame({'support':supports,
                           'confidence':confidences,
                           'lift':lifts,
                          'base':bases,
                          'add':adds})
resultshow.tail(8)

在这里插入图片描述

  • 1
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

shi_jiaye

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值