关联规则算法-FpGrowth的优点与FP树推导实例

本文介绍了FP-Growth算法的优势,指出其通过FP树减少IO操作并提高效率。详细阐述了算法流程,包括计算频繁项集、构建FP树、生成条件FP树以及挖掘关联规则。同时解释了FP树中的前缀路径和条件FP树的概念,并通过实例说明如何利用FP树挖掘频繁项集。
摘要由CSDN通过智能技术生成

前言:本篇也是自己的远古笔记,例子来自其他人的网站,对过程进行了汇总,删除了他网站里我认为多余的一些内容,增强可读性。忘了具体是哪个网站了,如果谁发现原网站了,还请艾特我,我标注引用。多谢!

算法优点:fpgrowth会把数据都存到一个叫FP树的数据结构里,能靠这个减少IO次数,而且最后整个计算过程只用扫描两次数据库,比Apriori算法快了很多;本文主要就是详细解释FP树算法;

具体流程

①先根据最小支持度把频繁项集算出来,②然后用频繁项集构建FP树,③再获取每个频繁项集的前缀路径去构建新的条件FP树,通过条件FP树挖掘频繁k项集,④迭代这个(第三个)步骤,一直到从FP树里挖掘出所有的频繁k项集以后就能提取关联规则了;

基本概念

前缀路径:FP树里,从根节点到目标节点a(不包括a)的这条路径,就是a的前缀路径。

条件FP树:以想挖掘的那个节点为叶子结点的FP树的子树。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值