fp_growth(Frequent Pattern tree)关联算法

FP-Growth是由韩家炜提出的高效挖掘频繁项集的算法,它通过构建FP树来减少数据扫描次数。该算法在大数据量下可能消耗大量内存,但比Apriori更高效。文章介绍了FP-Growth的基本流程、示例解释、FP树构建以及如何从FP树中抽取频繁项集。同时,提出了针对内存问题的改进算法UFP。
摘要由CSDN通过智能技术生成

注意:此方法笔者已经试过,计算关联词,在跑大批量数据模型的时候,很消耗内存。打个比方,如果你的数据集足够大,内存全部能吃完。具体一点,每个子列表有100个词,共500个子列表,16个G不够用的,可以想象上万条以上是什么情况。
改进的方法:
1、upgraded FP-growsth, UFP 算法
http://www.bjutxuebao.com/bjgydx/article/2016/0254-0037-42-5-697.html#outline_anchor_19
2、频繁模式挖掘中Apriori、FP-Growth和Eclat算法的实现和对比(Python实现)
https://www.cnblogs.com/infaraway/p/6774521.html

FP-growth算法理解

FP-growth(Frequent Pattern Tree, 频繁模式树),是韩家炜老师提出的挖掘频繁项集的方法,是将数据集存储在一个特定的称作FP树的结构之

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

平原2018

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值