FP-growth算法通俗讲解

FP-growth算法是一种高效挖掘频繁项集的算法,对比Apriori算法,其速度更快。该算法主要包括创建FP树和挖掘频繁项集两步。在FP树中,频繁项集以路径形式存储,相同元素的集合共享部分结构。通过遍历数据集构建FP树,然后从FP树中生成条件模式基,进而构建条件FP树,以此发现更多频繁项集。
摘要由CSDN通过智能技术生成

       FP-growth算法是一种高效发现频繁集的方法。例如你在搜索引擎中搜索一个词,它会自从补全查询词项,该处用到了FP-growth算法,通过查看互联网上的用词来找出经常在一块出现的词。【FP(Frequent Pattern)】

       FP-growth算法基于Apriori算法,但是比Apriori算法执行速度快,通常性能要好两个数量级以上。FP-growth算法虽然能更高效地发现频繁项集,但是不能用于发现关联规则。

       FP-growth算法将数据集存储在一个特定的FP树的结构之后发现频繁项集或频繁项对,即常在一块出现的元素项的集合FP树。FP-growth算法只需要对数据库进行两次扫描,而Apriori算法对于每个潜在的频繁项集都会扫描数据集判定给定模式是否频繁,因此FP-growth算法速度比Apriori算法快。

       FP-growth发现频繁项集的过程如下:

       (1)构建FP树

       (2)从FP树中挖掘频繁项集

一、创建FP树的数据结构

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值