Word Count案例完成过程

繁星点点190

已于 2022-05-27 19:46:54 修改

阅读量466

点赞数 1

分类专栏：虚拟机学习文章标签： hadoop mapreduce hdfs

于 2022-05-18 10:10:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/A157190/article/details/124836191

版权

Maven MapReduce Hadoop WordCount 集群部署

关键词由CSDN通过智能技术生成

虚拟机学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Word Count案例完成过程

前期准备

在D盘中创建input和hadoop两个文件夹，并在input文件夹下依次建立inputword文件夹，1.txt。截图如下：

环境准备
1. 1. 1. 创建一个maven工程。

1. 1. 1. 在pom.xml文件中加入如下依赖：
    2. 编写log4j的配置文件log4j.properties

编写程序
1. 1. 1. 创建 “com.atguigu.mapreduce.wordcount”包
    2. 在包下创建WordCountMapper类，WordCountReducer类，WordCountDriver类。
    3. 编写WordCountMapper类，截图如下：
    4. 编写WordCountReducer类，截图如下：
    5. 编写WordCountDriver类，截图如下：

Windows环境下运行测试
1. 1. 1. 运行成功截图：

1. 1. 1. 执行结果截图：

Hadoop集群实现
1. 1. 1. 新建一个包” com.atguigu.mapreduce.wordcount2”,同时复制WordCountMapper，WordCountReducer，WordCountDriver 到新建的包中。并运行WordCountDriver。截图如下：

1. 1. 1. 在pom.xml文件中加入如下依赖：

1. 1. 1. 将wordcount2进行打包，将打包好的包放在桌面上，命名为wc.jar。

1. 1. 1. 打开虚拟机后开启集群，将wc.jar拖入hadoop3.1.4文件夹中。
1. 1. 1. 在HDFS中创建input文件夹，并将windows中的1910224103.txt上传到此文件夹。
1. 1. 1. 打开集群查看，显示如下：

1. 1. 1. 在终端输入如下命令，并在yarn监控页面检查运行情况，截图如下：

1. 1. 1. 刷新集群，打开output文件夹查看结果，截图如下：

繁星点点190

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

繁星点点190 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。