大数据学习笔记(二)-官方案例-Grep/WordCount

最新推荐文章于 2022-08-16 14:00:47 发布

木子丶Li

最新推荐文章于 2022-08-16 14:00:47 发布

阅读量322

点赞数

分类专栏：大数据-hadoop 文章标签： hadoop mapreduce 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/L531003231/article/details/112009517

版权

大数据-hadoop 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1、官方Grep案例

1.首先，在hadoop-2.7.2文件夹下创建一个input目录
然后，将etc/hadoop/*.xml复制到input目录中

cp etc/hadoop/*.xml input/

2.然后启动hadoop中的examples包中的grep案例，知道input路径和output路径,
注意：此时若output文件夹存在，则会报output已存在错误

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z]+'

在这里插入图片描述
执行完之后，output目录下将多两个文件

_success是一个标识，结果在part-r-00000文件中
打开看看：说明运行成功，有一处满足规定的正则表达式‘dfs[a-z]+’

2.hadoop只经典WordCount案例

在hadoop2.7.2目录下创建wcinput文件夹，在该文件夹中创建wc.input文件，vi编辑器写入几个单词，内容如下
执行wordcount案例

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput wcoutput

在这里插入图片描述

查看结果

可以看到，刚刚在文件中输入的单词被统计出数量了。
WordCount案例完成

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

木子丶Li 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。