hadoop中使用python写mapreduce遇到的问题

用python测试下mapreduce,于是去百度了一个博客,直接按照步骤来,按其一步一步的来,但是结果一直错误。于是google找到一篇更加详细的,才发现刚才看的博客是copy的这个英文版的。 英文版的很全面,而且指令与中文版的不太一样。我按照英文版提供的指令,顺利的完成了python写mapreduce的计数。但想了想,耽误了我好长时间。以后尽量用google吧。

使用python写mapreduce的感觉是,省事,舒服,不需要继承什么类,直接标准输入与输出,要什么逻辑写什么逻辑,直接与业务挂钩。不过这只是刚开始用的体验,以后会记录更多的使用python编写mapreduce的感受。

记录python执行的指令 

中文版 测试有误

 hadoop@ubuntu:/usr/local/hadoop$ bin/hadoop jar contrib/streaming/hadoop-0.19.1-streaming.jar
 -mapper /home/hadoop/mapper.py -reducer /home/hadoop/reducer.py -input gutenberg/*
-output gutenberg-output

英文原版提供的

1
2
3
4
hduser@ubuntu:/usr/local/hadoop$ bin/hadoop jar contrib/streaming/hadoop-*streaming*.jar \
-file /home/hduser/mapper.py    -mapper /home/hduser/mapper.py \
-file /home/hduser/reducer.py   -reducer /home/hduser/reducer.py \
-input /user/hduser/gutenberg/* -output /user/hduser/gutenberg-output
是不是很有条理,而且 如果想指定reducer的个数,可以这样子:

1
hduser@ubuntu:/usr/local/hadoop$ bin/hadoop jar contrib/streaming/hadoop-*streaming*.jar -D mapred.reduce.tasks=16 ...

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值