FP-growth频繁模式增长方法

Stupid-Tyro

于 2019-05-10 12:06:56 发布

阅读量642

点赞数

文章标签： fpgrowth 频繁模式增长方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33036613/article/details/90055594

版权

advancedos 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

FP-growth频繁模式增长方法

先进行数据库投影，得到频繁项然后通过构造一个压缩的数据库结构–FP树来对它们进行挖掘
首先扫描数据库，得到频繁项的列表，频繁项集按支持度计数的递减顺序排序，
创建树的根部，第二次扫描数据库，对第一个事务的扫描可以得到树的第一个分支，只有那些在频繁项集中的项才会被选中，分支中节点的计数代表了树中该节点项所出现的次数，增加计数
节点排列顺序按照项集列表中的顺序

id	项集
1	f,a,c,d,g,i,m,p
2	a,b,c,f,l,m,o
3	b,f,h,j,o
4	b,c,k,s,p
5	a,f,c,e,l,p,m,n

得L = {(f,4),(c,4),(a,3),(b,3),(m,3),(p,3)}
插入两个样本之后的FP树：
在这里插入图片描述
最终FP树

程序相关错误及其修正
AttributeError: ‘dict’ object has no attribute ‘iteritems’

Python3.5中：iteritems变为items

dictionary changed size during iteration
list(dict)

AttributeError: ‘dict’ object has no attribute ‘has_key’
key in dict

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。