MapReduce编程之WordCount实例

1、启动集群

start-all.sh

在这里插入图片描述

mapreduce编程wordcount,实现统计一个超大文件中每个单词出现的个数

========================

新建java工程

在这里插入图片描述

点击next
在这里插入图片描述
finish完成

导入jar包

hadoop-2.5.2\share\hadoop\common
hadoop-2.5.2\share\hadoop\common\lib
hadoop-2.5.2\share\hadoop\hdfs
hadoop-2.5.2\share\hadoop\hdfs\lib
hadoop-2.5.2\share\hadoop\mapreduce
hadoop-2.5.2\share\hadoop\mapreduce\lib
hadoop-2.5.2\share\hadoop\yarn
hadoop-2.5.2\share\hadoop\yarn\lib

右击工程Build PathConfigure Build Path
在这里插入图片描述
点击Add Library
在这里插入图片描述
选择User Library
在这里插入图片描述
再点击User Libraries按钮
在这里插入图片描述
点击new,新建一个用户自定义类库
在这里插入图片描述
输入类库的名称mrlib,点击OK
在这里插入图片描述
选择mrlib,点击AddExternal JARs
在这里插入图片描述
选择整理好的所有jar包(lib文件夹下)导入,然后依次选择完成
在这里插入图片描述
完成之后可以看到所有导入的jar包。
在这里插入图片描述

定义三个类,一个map类,一个reduce类,一个runjob类

Map类
在这里插入图片描述
Reduce类
在这里插入图片描述
Job类,需要指定map类,reduce类,输入与输出路径等

在这里插入图片描述

执行

  • 需要拷贝org目录到工程src目录下
  • 代码中Configuration类需要指定两个属性,如上图
Configuration conf = new Configuration();
conf.set("fs.defaultFS", "hdfs://node1:8020");
conf.set("yarn.resourcemanager.hostname", "node1");

可以看到控制台的日志情况,说明map-reduce任务已成功执行
在这里插入图片描述
刷新输出目录output/wc,可以看到生成了两个文件,打开part-文件,可以看到输出结果。

  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

oifengo

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值