hadoop上运行mahout的fpgrouth算法

最新推荐文章于 2023-10-09 15:01:52 发布

菩提小师傅

最新推荐文章于 2023-10-09 15:01:52 发布

阅读量1k

点赞数

分类专栏：数据挖掘文章标签：数据挖掘 mahout fpgrouth hadoop mapreduce

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/iphone4grf/article/details/46234645

版权

数据挖掘专栏收录该内容

3 篇文章 0 订阅

订阅专栏

运行环境

JDK1.7

hadoop-1.2.1

mahout0.9

运行命令：

hadoop jar mahout-examples-0.9-job.jar org.apache.mahout.fpm.pfpgrowth.FPGrowthDriver -i /user/hadoop/testdata/fptree/fptree.txt -o /home/hadoop/fpdir/output1 -k 4 -method mapreduce -regex '[\ ]' -s 40

解释：-i 输入路径 -o 输出路径 -k 4表示找出和某个item相关的前十个频繁项 -method 表示使用mapreduce来运行这个作业，-regex '[\ ]'表示每行数据是用空白来间隔item的，-s 40表示只统计最少出现40次的项。

结果页列表：

frequentpatterns中记录的包含每个item的频繁项的序列文件

频繁项查看命令：

mahout seqdumper -i /home/hadoop/fpdir/output1/frequentpatterns/part-r-00000

提示：路径为hdfs上的路径

菩提小师傅

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。