原创  fp growth 实现 收藏

近日,准备使用fp growth写个程序,挖掘频繁模式。但是从han jia wei哪里下载的c语言程序效率非常低。根本不能满足大数据量的要求。

仔细分析源代码发现,fp growth需要生成很多棵树,每个结点路径都需要保存,还是非常消耗资源的。

考虑之后,使用hadoop编写了一个简单的fp growth,总是耗尽java的内存。最后,限制了结点的数量,得到一个计算结果。

发表于 @ 2009年03月21日 10:39:00 | 评论( loading... ) | 编辑| 举报| 收藏

旧一篇:相似性计算 | 新一篇:eclipse 单机测试 hadoop

  • 发表评论
  • 评论内容:
  •  
Copyright © poson
Powered by CSDN Blog