FP Growth算法

最新推荐文章于 2021-01-26 15:40:43 发布

Tristan_Jia

最新推荐文章于 2021-01-26 15:40:43 发布

阅读量504

点赞数

分类专栏： Introduction Data Mining 文章标签： FP 数据挖掘

Introduction 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

FP Growth算法

FP Growth算法

Preface

Frequent Pattern 算法降低了Aproir挖掘算法的代价，不需要生成候选项目队列和不断扫描整个数据库。

过程

构架一棵初始FP树T；构建头表
FP树的挖掘
原则&步骤
- 确定最小频繁阈值，全局适用(如阈值为3)
- 从头表最后一项向前推进（如N）
- 每一项步骤
  - 找到N的条件模式基，得到子树T1
  - 派生频繁项目集S1，与直接频繁集就是最后的结果
  - 得到N的条件模式基后，需要删除小于阈值的节点
  - 这些条件模式基当中有多节点的路径，对其进行递归或者排列组合
- 最后在统计表中显示的结果类似{(f: 3,c: 3)}|m，主要表示节点-节点之间的一对一关系

关于大数据库的处理方法

如果内存足够可以放在内存中
如果内存不足，将大数据库处理成为若干小数据库，分别处理
- 这种小数据库称为投射数据库，对节点N来说就是N-投射数据库

笔记总结于

Frequent Pattern 挖掘之二(FP Growth算法)

其他相关资料

相关java实现代码：Aprior算法简化算法——FP-Tree思想与实现

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。