MapReduce编程之WordCount实例

最新推荐文章于 2021-08-26 15:04:18 发布

oifengo

最新推荐文章于 2021-08-26 15:04:18 发布

阅读量229

点赞数 4

分类专栏： # Hadoop入门

本文链接：https://blog.csdn.net/weixin_39381833/article/details/84777932

版权

Hadoop入门专栏收录该内容

38 篇文章 3 订阅

订阅专栏

1、启动集群

start-all.sh

在这里插入图片描述

mapreduce编程wordcount，实现统计一个超大文件中每个单词出现的个数

========================

新建java工程

在这里插入图片描述

点击next
在这里插入图片描述
finish完成

导入jar包

hadoop-2.5.2\share\hadoop\common
hadoop-2.5.2\share\hadoop\common\lib
hadoop-2.5.2\share\hadoop\hdfs
hadoop-2.5.2\share\hadoop\hdfs\lib
hadoop-2.5.2\share\hadoop\mapreduce
hadoop-2.5.2\share\hadoop\mapreduce\lib
hadoop-2.5.2\share\hadoop\yarn
hadoop-2.5.2\share\hadoop\yarn\lib

右击工程Build PathConfigure Build Path
在这里插入图片描述
点击Add Library

选择User Library

再点击User Libraries按钮

点击new，新建一个用户自定义类库

输入类库的名称mrlib，点击OK

选择mrlib，点击AddExternal JARs

选择整理好的所有jar包(lib文件夹下)导入，然后依次选择完成
在这里插入图片描述
完成之后可以看到所有导入的jar包。

定义三个类，一个map类，一个reduce类，一个runjob类

Map类
在这里插入图片描述
Reduce类

Job类，需要指定map类，reduce类，输入与输出路径等

在这里插入图片描述

执行

需要拷贝org目录到工程src目录下
代码中Configuration类需要指定两个属性，如上图

Configuration conf = new Configuration();
conf.set("fs.defaultFS", "hdfs://node1:8020");
conf.set("yarn.resourcemanager.hostname", "node1");

可以看到控制台的日志情况，说明map-reduce任务已成功执行
在这里插入图片描述
刷新输出目录output/wc，可以看到生成了两个文件，打开part-文件，可以看到输出结果。

oifengo

关注

4
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
MapReduce编程之WordCount实例

1、启动集群start-all.shmapreduce编程wordcount，实现统计一个超大文件中每个单词出现的个数========================新建java工程点击nextfinish完成导入jar包hadoop-2.5.2\share\hadoop\commonhadoop-2.5.2\share\hadoop\common\libhadoop-...
复制链接

扫一扫