运行hadoop自带的word count小案例

1. 创建一个文件上传目录

1)首先进入到hadoop文件夹下(命令:cd /usr/local/hadoop);
2)创建目录“/test/wordcount”,用来存放hadoop自带的wordcount例子的数据文件。

bin/hadoop fs -mkdir -p /test/wordcount (创建上传文件目录)
bin/hadoop fs -ls / (查看创建的文件目录)

2. 创建输出路径

1)创建目录“/output”,用来存放运行Mapreduce任务后输出的结果文件。

bin/hadoop fs -mkdir -p /output/ (创建输出结果文件存放目录)
bin/hadoop fs -ls / (查看创建的文件目录)

3. 创建本地输入文件 vi wordcount.txt

在这里插入图片描述这是我输入的测试数据,可以自行修改

4. 将上述创建的本地文件上传到HDFS中

bin/hadoop fs -put wordcount.txt /test/wordcount/
bin/hadoop fs -ls /test/wordcount/
在这里插入图片描述
bin/hadoop fs -text /test/wordcount/wordcount.txt
在这里插入图片描述查看上传进去的内容

5. 运行案例

5.1 找到examples例子
运行Hadoop自带的wordcount首先需要找到examples例子(hadoop-mapreduce-examples-2.7.5.jar),该例子位于Hadoop文件夹下的“/share/hadoop/mapreduce”目录下。可通过如下命令查看:
在这里插入图片描述
5.2 运行hadoop自带的wordcount程序(还是在hadoop主目录下)

bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.5.jar wordcount /test/wordcount /output/wordcount

注意:此处的输出目录output下的输出结果文件名wordcount不是固定的,在执行不同的输入文件时可相应地更改为不同的文件名称。避免因同名而发生冲突,导致最新上传的本地文件得不到执行,而只保留之前的执行结果。

在这里插入图片描述这里是成功的显示结果
5.3 查看执行结果

bin/hadoop fs -ls /output/wordcount
bin/hadoop fs -text /output/wordcount/part-r-00000

在这里插入图片描述这就显示成功了

完成所有的操作后如果不想保留输入输出目录,可将其一一删除,命令如下:

删除输入文件目录:bin/hadoop fs -rmr /test

删除输出文件目录:bin/hadoop fs -rmr /output

  • 0
    点赞
  • 19
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值