FP-growth算法(APriori的改进版本)

FP-growth算法是对Apriori算法的改进,旨在提高数据挖掘效率。该算法通过构建复杂的FP树结构,以迭代递归的方式找出频繁集,但无法直接发现关联规则。本文详细介绍了FP-growth的四个关键步骤:创建FP树数据结构、处理事务数据集、构建FP树以及从中挖掘频繁项集。
摘要由CSDN通过智能技术生成

事实证明想要优化一个算法要付出巨大的努力,甚至要将原本的算法推倒重来,FP-growth让我深刻的理解了这一点,为了改进Apriori算法(仅仅提高两个数量级)就要放弃原本算法思想很简单的算法,强行去构造一颗让人捉摸不透的树,并采用迭代递归得到频繁集,而且这种算法不能和Apriori算法一样可以发现关联规则。下面是具体的算法实现。

(一)创建FP树的数据结构

class fpleave:
    def __init__(self,name,count,parent):
        self.name=name
        self.count=count
        self.parent=parent
        self.children={}
    def add(self,num):
        self.count+=num

类中存放节点名字的变量和一个计数值,parent存放父节点,children存在子集。

(二)事物数据集的处理

通常包括移除非频繁项和排序:

def filter(data,num):
    dic={}
    ListOK=[]
    D=[]
    haha=[]
    for i in data:
        for j in i:
            if j not in dic:
                dic[j]=1
        
  • 2
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值