三十二、基于Hadoop伪分布式运行Hadoop自带wordcount案例(1)

2401_84103512

已于 2024-05-01 15:29:37 修改

阅读量15

点赞数 5

分类专栏：程序员文章标签：分布式 hadoop 大数据

于 2024-05-01 15:29:36 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84103512/article/details/138373760

版权

程序员专栏收录该内容

241 篇文章 0 订阅

订阅专栏

2.进入虚拟机浏览器地址栏localhost:50070和localhost:8088查看集群状态：

注：Wordcount是MapReduce的入门示例程序，相当于我们在学某个编程语言时写的Hello World示例一样。这个程序可以统计某个文件中，各个单词出现的次数。Wordcount程序自带的jar包已经放置在hadoop安装目录下的 /share/hadoop/mapreduce 文件夹中。

3.配置wordcount环境：

（1）进入Hadoop安装路径下可以看到：图中的txt文件为Hadoop自带的测试文件，这里将进行自定义文件进行操作。

（2）在这里我们新建wordcount.txt文件进行测试，文本内容如下：

（3）在HDFS根目录下新建input目录：

（4）将本地的wordcount.txt上传到HDFS的input目录下:

（5）查看文件是否上传成功:

注：如图出现/input和/input/wordcount.txt文件即为上传成功

4.运行wordcount案例:

注：使用hadoop jar命令 +mapreduce自带的jar包路径(绝对路径)+文件名+输入路径+输出路径 #此处jar包根据自身实际情况进行修改

运行过程注意观察这几处字样，即为运行成功：

最后

由于篇幅限制，小编在此截出几张知识讲解的图解

P8级大佬整理在Github上45K+star手册，吃透消化，面试跳槽不心慌

P8级大佬整理在Github上45K+star手册，吃透消化，面试跳槽不心慌

P8级大佬整理在Github上45K+star手册，吃透消化，面试跳槽不心慌

P8级大佬整理在Github上45K+star手册，吃透消化，面试跳槽不心慌

P8级大佬整理在Github上45K+star手册，吃透消化，面试跳槽不心慌

kq-1714548559904)]

[外链图片转存中…(img-FdrsQLyS-1714548559904)]

[外链图片转存中…(img-YYwDbNmc-1714548559905)]

本文已被CODING开源项目：【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
三十二、基于Hadoop伪分布式运行Hadoop自带wordcount案例(1)

由于篇幅限制，小编在此截出几张知识讲解的图解[外链图片转存中…(img-FdrsQLyS-1714548559904)][外链图片转存中…(img-YYwDbNmc-1714548559905)]本文已被CODING开源项目：【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。