关联规则挖掘理论和算法（数据挖掘十大算法---Apriori算法）

最新推荐文章于 2023-01-09 21:47:38 发布

Gyanga

最新推荐文章于 2023-01-09 21:47:38 发布

阅读量1.4k

点赞数

文章标签：算法数据挖掘 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Gyanga/article/details/109132472

版权

一、（Apriori）发现频繁项目集

通过用户给定的 最小支持度，寻找所有频繁项目集（满足Support不小于Minsupport的所有项目子集）
逐层发现算法，按照项集的长度由下到大逐级进行，并最后发现频繁几项集

项（Item）
购物篮（Transcation）：交易
项集（Itemset）：所有项的集合
K项集：在集合中包含K个项的项集

支持度：support(x)=count(x) / |D| *100%
——x出现的概率

count(x):一个项集x在数据库中出现的次数x
D：数据库（交易的个数）

置信度：confidence(X->Y) = support(X->Y) / support(X) *100%
support(X)=support(X∩Y)
———X出现了的同时Y出现的概率

算法实现：
输入：数据库D；最小支持度minsup_count
输出：频繁项目集L

                                       样本事务数据库

TID	Itemset
1	A,B,C,D

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
关联规则挖掘理论和算法（数据挖掘十大算法---Apriori算法）

一、（Apriori）发现频繁项目集通过用户给定的最小支持度，寻找所有频繁项目集（满足Support不小于Minsupport的所有项目子集）逐层发现算法，按照项集的长度由下到大逐级进行，并最后发现频繁几项集项（Item）购物篮（Transcation）：交易项集（Itemset）：所有项的集合K项集：在集合中包含K个项的项集支持度：support(x)=count(x) / |D| *100%——x出现的概率count(x):一个项集x在数据库中出现的次数xD：数据库（交易的个
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。