1、官方Grep案例
1.首先,在hadoop-2.7.2文件夹下创建一个input目录
然后,将etc/hadoop/*.xml复制到input目录中
cp etc/hadoop/*.xml input/
2.然后启动hadoop中的examples包中的grep案例,知道input路径和output路径,
注意:此时若output文件夹存在,则会报output已存在错误
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z]+'
执行完之后,output目录下将多两个文件
_success是一个标识,结果在part-r-00000文件中
打开看看:说明运行成功,有一处满足规定的正则表达式‘dfs[a-z]+’
2.hadoop只经典WordCount案例
- 在hadoop2.7.2目录下创建wcinput文件夹,在该文件夹中创建wc.input文件,vi编辑器写入几个单词,内容如下
- 执行wordcount案例
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount wcinput wcoutput
- 查看结果
可以看到,刚刚在文件中输入的单词被统计出数量了。
WordCount案例完成