CentOS6.8下Hadoop2.7.2怎么运行自带的wordcount程序

最新推荐文章于 2021-05-25 21:42:26 发布

Sophia天雪

最新推荐文章于 2021-05-25 21:42:26 发布

阅读量2.5k

收藏 2

点赞数 1

分类专栏： Linux hadoop 大数据文章标签： hadoop CentOS wordCount Linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sophiaFXR/article/details/51833090

版权

Linux 同时被 3 个专栏收录

19 篇文章 0 订阅

订阅专栏

大数据

4 篇文章 0 订阅

订阅专栏

hadoop

1 篇文章 0 订阅

订阅专栏

CentOS6.8下Hadoop2.7.2怎么运行自带的wordcount程序

1 准备工作

1.1 创建输入输出路径

首先在hdfs中创建数据目录，用来指定运行wordcount程序的输入输出路径。Hadoop命令在hadoop文件夹下的bin目录下，可通过如下命令查看：

命令：ll /usr/local/hadoop/bin

查看结果如图1所示：

图1 查找hadoop命令

（1）创建文件上传目录

1）首先进入到hadoop文件夹下（命令：cd /usr/local/hadoop）；

2）创建目录“/data/wordcount”，用来存放hadoop自带的wordcount例子的数据文件。

命令：bin/hadoop fs -mkdir -p /data/wordcount （创建上传文件目录）

命令：bin/hadoop fs -ls / （查看创建的文件目录）

命令操作结果如图2所示：

图2 创建文件上传目录

（2）创建结果输出目录

1）创建目录“/output”，用来存放运行Mapreduce任务后输出的结果文件。

命令：bin/hadoop fs -mkdir -p /output/ （创建输出结果文件存放目录）

命令：bin/hadoop fs -ls / （查看创建的文件目录）

命令操作结果如图3所示：

图3 创建结果输出目录

1.2 创建本地输入文件

命令： sudo vi /usr/inputword

输入文件内容，如图4所示：

图4 创建本地输入文件

文件创建完成之后可通过命令“cat /usr/inputword”查看文件内容，如图5所示：

图5 查看本地文件内容

2 上传文件

（1）将上述创建的本地文件上传到HDFS中。

命令：bin/hadoop fs –put /usr/inputword /data/wordcount/

注意：当需要多次执行wordcount程序时，如果不需要保留前一次上传到/data/wordcount/目录下的本地文件inputword，可将其删除，然后直接修改本地文件inputword里面的内容，再重新上传到/data/wordcount/目录下。删除上传到/data/wordcount/目录下的本地文件inputword文件的命令为：

bin/hadoop fs –rm /data/wordcount/inputword

如果需要保留每次执行时上传到/data/wordcount/目录下的本地文件，可以重新创建新的本地文件，只要保证每次创建的本地文件名称不相同即可，然后将不同名的本地文件重新上传到HDFS中。

（2）完成上传后可查看文件情况

命令：bin/hadoop fs -ls /data/wordcount

（3）还可查看上传到HDFS中的文件的内容

命令：bin/hadoop fs -text /data/wordcount/inputword

执行结果如图6所示：

图6 上传文件执行结果

3 运行wordcount例子

3.1 找到examples例子

运行Hadoop自带的wordcount首先需要找到examples例子（hadoop-mapreduce-examples-2.7.2.jar），该例子位于Hadoop文件夹下的“/share/hadoop/mapreduce”目录下。可通过如下命令查看：

（1）直接在根目录下查看：

命令：ls /usr/local/hadoop/share/hadoop/mapreduce

查看结果如图7所示：

图7 在根目录下查找examples

（2）进入Hadoop文件目录下查看（我的Hadoop文件夹在“/usr/local”目录下）：

命令：1）cd /usr/local/hadoop

2）ls share/hadoop/mapreduce

查询结果如图8所示：

图8 在Hadoop文件目录下查找examples

3.2 运行hadoop自带的wordcount程序

命令：

bin/hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/

hadoop-mapreduce-examples-2.7.2.jar wordcount /data/wordcount /output/wordcount

注意：此处的输出目录output下的输出结果文件名wordcount不是固定的，在执行不同的输入文件时可相应地更改为不同的文件名称。避免因同名而发生冲突，导致最新上传的本地文件得不到执行，而只保留之前的执行结果。

程序运行信息如图9所示：

图9_1 程序运行信息

图9_2 程序运行信息

图9_3 程序运行信息

图9_4 程序运行信息

3.3 查看执行结果

命令：bin/hadoop fs -text /output/wordcount/part-r-00000

显示结果如图10所示：

图10 程序执行结果

注意：此处的wordcount是指执行wordcount程序时指定的输出目录下的输出结果文件，可通过修改此文件名来显示执行不同文件各自所得的输出结果。

补充说明：完成所有的操作后如果不想保留输入输出目录，可将其一一删除，命令如下：

删除输入文件目录：bin/hadoop fs -rmr /data

删除输出文件目录：bin/hadoop fs -rmr /output

执行上述两条命令后可通过如下命令查看到显示结果中只剩下tmp文件目录：

bin/hadoop fs -ls /

Sophia天雪

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值