Hadoop的运行模式包括:本地模式、伪分布式模式以及完全分布式模式
Hadoop官网地址:https://hadoop.apache.org/
本次使用的Hadoop的版本是2.7.2
官网文档:https://hadoop.apache.org/docs/r2.7.2/hadoop-project-dist/hadoop-common/SingleCluster.html
目录
1、在文件夹hadoop-2.7.2下面创建一个input文件夹
1、在hadoop-2.7.2文件夹下创建一个wcinput文件夹
4、回到hadoop目录:/opt/module/hadoop-2.7.2
一、官方Grep案例
1、在文件夹hadoop-2.7.2下面创建一个input文件夹
mkdir input
2、将Hadoop的xml配置文件复制到input
cp etc/hadoop/*.xml input
3、执行share目录下的mapreduce程序
直接使用hadoop命令需要配置环境变量,否则应该写 “bin/hadoop”
(善于利用Tab键)
hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar grep input/ output 'dfs[a-z.]+'