本地运行模式:单机运行,生产环境不用;
伪分布式模式:单机运行,但是具备Hadoop集群的所有功能,一台服务器模拟一个分布式环境,生产环境不用;
完全分布式模式:多台服务器组成分布式环境,生产环境使用。
本地运行模式(了解):
1.在hadoop-3.2.2文件下创建一个wcinput文件夹:
[xiaobai@hadoop102 hadoop-3.2.2]$ mkdir wcinput
2.在wcinput文件夹下创建一个word.txt文件:
[xiaobai@hadoop102 hadoop-3.2.2]$ cd wcinput
3.编辑word.txt文件:
[xiaobai@hadoop102 hadoop-3.2.2]$ vim word.txt
4.回到Hadoop目录/opt/module/hadoop-3.2.2:
执行程序:
[xiaobai@hadoop102 hadoop-3.2.2]$ bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.2.2.jar wordcount wcinput/ ./wcoutput
5.查看结果:
[xiaobai@hadoop102 wcoutput]$ cat part-r-00000
hello 1
welcome 1
world 1
tips:要求输出路径wcoutput不存在,否则报异常:org.apache.hadoop.mapred.FileAlreadyExistsException;