目标
1.运行wordcount
1)Hadoop官方网站:http://hadoop.apache.org/
2)Hadoop运行模式包括:本地模式、伪分布式模式以及完全分布式模式。
本地模式:单机运行,只是用来演示一下官方案例。生产环境不用。
伪分布式模式:也是单机运行,但是具备Hadoop集群的所有功能,一台服务器模拟一个分布式的环境。个别缺钱的公司用来测试,生产环境不用。
完全分布式模式:多台服务器组成分布式环境。生产环境使用
首先进入hadoop目录
然后输入
mkdir wcinput
创建wcinput这个文件夹
进入wcinput
在里创建一个Word.txt
vim word.txt
在里面随便输入点单词
保存退出后
回到hadoop目录
注意wcoutput不能存在
输入
sbin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.4.jar wordcount wcinput wcoutput
进入wcoutput
里面有这个两文件输入
cat part-r-00000
可以查看统计的结果
如果wcoutput存在就会报错