hadoop运行MR程序笔记

这里做个笔记来记录执行步骤。

运行条件:将WordCount.java文件放在hadoop的安装目录下,并在目录下创建输入目录input,目录下有输入文件file1和file2。

 

运行步骤:

1、在集群上创建输入文件夹

bin/hadoop fs -mkdir input

2、上传本地目录input下以file为前缀的文件到集群上的input目录下:

bin/hadoop fs -put input/file* input

3、编译WordCount.java程序

javac -classpath hadoop-0.20.2-core.jar:

lib/commons-cli-1.2.jar -d WordCount WordCount.java

4、将编译结果打成jar包

jar -cvf wordcount.jar -C WordCount

5、在集群上面运行WordCount程序

bin/hadoop jar wordcount.jar WordCount input output

6、查看结果

bin/hadoop fs -cat output/part-r-00000

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值