aprioir算法_关联规则

最新推荐文章于 2024-05-31 16:54:13 发布

醉酒奶糖

最新推荐文章于 2024-05-31 16:54:13 发布

阅读量784

点赞数

文章标签： aprioir算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_33019705/article/details/113374222

版权

关联规则用于评估商品同时出现的概率，通过支持度和置信度衡量。Apriori算法通过频繁项集挖掘生成规则，而FP-Growth算法使用FP-Tree数据结构直接提取频繁项集，减少数据库扫描次数。两者都是挖掘交易数据中隐藏模式的有效方法。

摘要由CSDN通过智能技术生成

关联规则：评定规则的标准

支持度：规则前项LHS和规则后项RHS所包括的商品都同时出现的概率，LHS和RHS商品的交易次数/总交易次数。

置信度：在所有的购买了左边商品的交易中，同时又购买了右边商品的交易机率，包含规则两边商品的交易次数/包括规则左边商品的交易次数。

提升度(有这个规则和没有这个规则是否概率会提升，规则是否有价值)：无任何约束的情况下买后项的交易次数/置信度。提升度必须大于1才有意义。

一、Aprioir

多遍数据库扫描是昂贵的，挖掘长模式需要很多遍扫描，并产生大量候选。Aprioir具有的性质：频繁项集的所有非空子集也必须是频繁的。

首先找频繁一项集(满足最小支持度要求的项集)，在频繁一项集的基础上寻找频繁二项集，再依次寻找频繁三、四等等，直到没有满足最小支持度的项集。

再根据频繁项集产生关联规则。频繁项集的非空子集计算置信度，在一定置信度的情况下保留下来相应有用的规则。

Aprioir算法本来orange2.7算法可以实现，不知道为什么orange3给取消了这个算法

二、FP-Growth

FP-growth算法不同于Apriori算法生成候选项集再检查是否频繁的“产生-测试” 方法，而是使用一种称为频繁模式树(FP-Tree，PF代表频繁模式，Frequent Pattern)菜单紧凑数据结构组织数据，并直接从该结构中提取频繁项集。每个事务被映射到FP-tree的一条路径上，不同的事务会有相同的路径，因此重叠的越多，压缩效果越好。

FP-growth算法分为两个过程，一是根据原始数据构造FP-Tree，

首先扫描一遍数据集，找出频繁项的列表L，并且按照支持度排序，根据此排序调整原数据中事务的排序。然后开始构造FP-tree，根节点为空，处理每个事物时按照L中的顺序将事物中出现的频繁项添加到中的一个分支。(下图中D是通过指针连接上的，这样后期搜索时候，是直接知道D出现两次的)

构造完成FP-Tree后，选定叶节点，收集所有包含叶节点的前缀路径，通过把与叶节点相关联的支持度计数相加，得到叶节点的支持度计数，从而产生满足最小支持度的规则。

原文：http://www.cnblogs.com/fionacai/p/6131495.html

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
aprioir算法_关联规则

关联规则：评定规则的标准支持度：规则前项LHS和规则后项RHS所包括的商品都同时出现的概率，LHS和RHS商品的交易次数/总交易次数。置信度：在所有的购买了左边商品的交易中，同时又购买了右边商品的交易机率，包含规则两边商品的交易次数/包括规则左边商品的交易次数。提升度(有这个规则和没有这个规则是否概率会提升，规则是否有价值)：无任何约束的情况下买后项的交易次数/置信度。提升度必须大于1才有意义。一...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。