hadoop平台使用python编写mapreduce排序小程序

本文介绍了在Hadoop 2.6.5环境中,使用Python 2.7.5编写MapReduce程序进行字典值排序的步骤。涉及map.py和reducer.py的编写,以及遇到的常见错误及其解决方案,如文件编码、换行符、Python解释器路径等问题。同时,提供了Hadoop Streaming的jar包位置和运行命令的注意事项。
摘要由CSDN通过智能技术生成

编写环境

hadoop-2.6.5
python-2.7.5
xshell连接
金山云平台,一台master,3台selvet

数据类型

g 445
a 1117
b 222
c 333
d 444
e 123
f 345
h 456

map.py

  1 #!/usr/bin/env python
  2 import sys
  3 list1=[]
  4 for line in sys.stdin:
  5     line=line.strip()
  6     words = line.split("\n")
  7     list1.append(words[0])
  
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值