《机器学习实战》——FP-growth算法

最新推荐文章于 2024-06-09 08:00:00 发布

Jaeshn

最新推荐文章于 2024-06-09 08:00:00 发布

阅读量548

点赞数

分类专栏：机器学习文章标签： FP-growth算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cyx_1103/article/details/86691116

版权

FP-growth算法是基于Apriori算法构建的，Apriori算法是发现频繁项集的一种方法，但是Apriori算法是通过多次扫描数据集找到所有满足最小支持度的频繁项集，而FP-growth算法只扫描原始数据集两次，它发现频繁项集的基本过程分为两步：

构建FP树。需要对原始数据集扫描两遍，第一遍对所有元素项出现的次数进行统计，第二遍只考虑频繁元素。
挖掘频繁项集。

FP-growth算法只需要对数据库进行两次扫描，而Apriori算法对于每个潜在的频繁项集都会扫描数据集判定给定模式是否频繁，因此FP-growth算法的速度要比Apriori算法更快。

1 FP树数据结构

头指针表：记录所有频繁一项集出现的次数。

FP树：存储项集的出现频率，每个项集会以路径的方式存储在树中。

节点链表：相似项之间的链接。所有头指针表里的频繁一项集都是一个节点链表的头，依次指向FP树中该频繁一项集出现的位置。方便头指针表和FP树之间的练习查找和更新。

在这里插入图片描述

上面的事务列表将用于介绍生成FP树，设置支持度阈值为3，则出现次数不低于3次的项集为频繁项集，《机器学习实战》一书给出了FP树。

在这里插入图片描述

如上图，为带头指针表的FP树。

2 建立头指针

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
《机器学习实战》——FP-growth算法

FP-growth算法是基于Apriori算法构建的，Apriori算法是发现频繁项集的一种方法，但是Apriori算法是通过多次扫描数据集找到所有满足最小支持度的频繁项集，而FP-growth算法只扫描原始数据集两次，它发现频繁项集的基本过程分为两步：构建FP树。需要对原始数据集扫描两遍，第一遍对所有元素项出现的次数进行统计，第二遍只考虑频繁元素。挖掘频繁项集。FP-growth算法只...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。