关联规则算法-FpGrowth的优点与FP树推导实例

AhLe丶

已于 2022-08-07 19:07:49 修改

阅读量1k

点赞数 2

文章标签：数据分析 python

于 2022-08-07 19:07:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34242797/article/details/126214985

版权

本文介绍了FP-Growth算法的优势，指出其通过FP树减少IO操作并提高效率。详细阐述了算法流程，包括计算频繁项集、构建FP树、生成条件FP树以及挖掘关联规则。同时解释了FP树中的前缀路径和条件FP树的概念，并通过实例说明如何利用FP树挖掘频繁项集。

摘要由CSDN通过智能技术生成

前言：本篇也是自己的远古笔记，例子来自其他人的网站，对过程进行了汇总，删除了他网站里我认为多余的一些内容，增强可读性。忘了具体是哪个网站了，如果谁发现原网站了，还请艾特我，我标注引用。多谢！

算法优点：fpgrowth会把数据都存到一个叫FP树的数据结构里，能靠这个减少IO次数，而且最后整个计算过程只用扫描两次数据库，比Apriori算法快了很多；本文主要就是详细解释FP树算法；

具体流程

①先根据最小支持度把频繁项集算出来，②然后用频繁项集构建FP树，③再获取每个频繁项集的前缀路径去构建新的条件FP树，通过条件FP树挖掘频繁k项集，④迭代这个（第三个）步骤，一直到从FP树里挖掘出所有的频繁k项集以后就能提取关联规则了；

基本概念

前缀路径：FP树里，从根节点到目标节点a（不包括a）的这条路径，就是a的前缀路径。

条件FP树：以想挖掘的那个节点为叶子结点的FP树的子树。

最低0.47元/天解锁文章

关注

2
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。