eclipse运行hadoop自带的wordcount程序

最新推荐文章于 2022-09-15 20:59:15 发布

爱学习的胖胖

最新推荐文章于 2022-09-15 20:59:15 发布

阅读量807

点赞数

文章标签： wordcount hadoop eclipse

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/windyxue/article/details/88560413

版权

1.前提准备条件

hadoop已经启动，eclipse已经成功链接dfs

2.新建文件夹和文件

我是在home/psy下新建wordcounttest文件夹

a.txt 文件内容为hello world

b.txt文件内容为hello hadoop

3.在hdfs上新建input文件夹

在hadoop的根目录下，我的为/home/psy/downloads/hadoop，

新建input：hadoop fs -mkdir input

查看hdfs内容:hadoop fs -ls

4.将本地文件put到hdfs上

将a.txt和b.txt都put到input文件夹中

5.在eclipse中刷新，可以在name1下发现input文件夹

6.查找hadoop自带的wordcount所在位置

我的所在位置为/home/psy/downloads/hadoop/share/hadoop/mapreduce中

jar包名为hadoop-mapreduce-examples-2.7.6.jar

7.运行wordcount程序

output文件夹不需要建立

运行指令：

bin/hadoop jar /home/psy/downloads/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.6.jar wordcount /input /output

运行过程中会出现一个map100%,reduce 100%

8.eclipse中刷新列表

可以看到如下界面

查看运行结果：

运行一次以后系统会生成一个output文件夹，如果再次运行会提示output文件夹已经存在的错误所以需要在先删除output文件夹

删除的是hdfs上的文件

命令参考博文https://www.cnblogs.com/gaopeng527/p/4314215.html

output文件夹是空的，命令可以是hdfs dfs -rmdir /output

output文件夹不是空的，命令可以是hdfs dfs -rmr /output

爱学习的胖胖

关注

0
点赞
踩
7

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。