实战：关联规则挖掘

最新推荐文章于 2022-10-12 00:00:00 发布

qiu_zhi_liao

最新推荐文章于 2022-10-12 00:00:00 发布

阅读量2k

点赞数 4

分类专栏： DM

本文链接：https://blog.csdn.net/qiu_zhi_liao/article/details/90441529

版权

如何使用 Apriori 工具包

Apriori 虽然是十大算法之一，不过在 sklearn 工具包中并没有它，也没有 FP-Growth 算法。。这里教你个方法，来选择 Python 中可以使用的工具包，搜索工具包。

efficient-apriori 1.0.0找到这个工具包，然后在终端（windows 中叫anaconda prompt）

输入：pip install efficient-apriori

然后重新进入jupyter 模式；

接下来我们用这个工具包，跑一下超市购物的例子

from efficient_apriori import apriori
# 设置数据集
data = [('牛奶','面包','尿布'),
           ('可乐','面包', '尿布', '啤酒'),
           ('牛奶','尿布', '啤酒', '鸡蛋'),
           ('面包', '牛奶', '尿布', '啤酒'),
           ('面包', '牛奶', '尿布', '可乐')]
# 挖掘频繁项集和频繁规则
itemsets, rules = apriori(data, min_support=0.5,  min_confidence=1)
print(itemsets)
print(rules)

其中 data 是我们要提供的数据集，它是一个 list 数组类型。min_support 参数为最小支持度，用小数表示（不要用百分数）

min_confidence 是最小置信度，用小数表示（不要用百分数）

实际上，data 是个 List 数组类型，其中每个值都可以是一个集合。实际上你也可

最低0.47元/天解锁文章

qiu_zhi_liao

关注

4
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
实战：关联规则挖掘

如何使用 Apriori 工具包Apriori 虽然是十大算法之一，不过在 sklearn 工具包中并没有它，也没有 FP-Growth 算法。。这里教你个方法，来选择 Python 中可以使用的工具包，搜索工具包。efficient-apriori 1.0.0找到这个工具包，然后在终端（windows 中叫anaconda prompt）输入：pip install effici...
复制链接

扫一扫