FP-growth算法（APriori的改进版本）

最新推荐文章于 2020-11-24 15:57:27 发布

king的江鸟

最新推荐文章于 2020-11-24 15:57:27 发布

阅读量1.5k

点赞数 2

分类专栏：人工智能文章标签： FP-growth 算法数据挖掘改进

本文链接：https://blog.csdn.net/weixin_40939578/article/details/81775607

版权

FP-growth算法是对Apriori算法的改进，旨在提高数据挖掘效率。该算法通过构建复杂的FP树结构，以迭代递归的方式找出频繁集，但无法直接发现关联规则。本文详细介绍了FP-growth的四个关键步骤：创建FP树数据结构、处理事务数据集、构建FP树以及从中挖掘频繁项集。

摘要由CSDN通过智能技术生成

事实证明想要优化一个算法要付出巨大的努力，甚至要将原本的算法推倒重来，FP-growth让我深刻的理解了这一点，为了改进Apriori算法（仅仅提高两个数量级）就要放弃原本算法思想很简单的算法，强行去构造一颗让人捉摸不透的树，并采用迭代递归得到频繁集，而且这种算法不能和Apriori算法一样可以发现关联规则。下面是具体的算法实现。

（一）创建FP树的数据结构

class fpleave:
    def __init__(self,name,count,parent):
        self.name=name
        self.count=count
        self.parent=parent
        self.children={}
    def add(self,num):
        self.count+=num

类中存放节点名字的变量和一个计数值，parent存放父节点，children存在子集。

（二）事物数据集的处理

通常包括移除非频繁项和排序：

def filter(data,num):
    dic={}
    ListOK=[]
    D=[]
    haha=[]
    for i in data:
        for j in i:
            if j not in dic:
                dic[j]=1

最低0.47元/天解锁文章

king的江鸟

关注

2
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
FP-growth算法（APriori的改进版本）

事实证明想要优化一个算法要付出巨大的努力，甚至要将原本的算法推倒重来，FP-growth让我深刻的理解了这一点，为了改进Apriori算法（仅仅提高两个数量级）就要放弃原本算法思想很简单的算法，强行去构造一颗让人捉摸不透的树，并采用迭代递归得到频繁集，而且这种算法不能和Apriori算法一样可以发现关联规则。下面是具体的算法实现。（一）创建FP树的数据结构class fpleave: ...
复制链接

扫一扫

专栏目录