安装好你的hadoop之后可以先运行一下自带的wordcount程序,在这我说一下详细步骤。
因为hadoop的命令前都是hadoop XX XXX XXX类型的,所以大家可以学习一下关于hadoop的命令,用起来比较方便。这里推荐hadoop官方命令手册:http://hadoop.apache.org/docs/r1.0.4/cn/commands_manual.html
(1)运行前你要先建立一个input文件夹,就建在/opt/hadoop-2.7.3/下即可,其中/opt/hadoop-2.7.3是的我hadoop路径,文中提到不再赘述
hadoop fs -mkdir /input
然后,随便放进一个XXX.txt,这里我直接把notice.txt放入了
hadoop fs -put NOTICE.txt /input
通过命令查看你的input文件夹是否新建成功,是否有notice.txt这个文件在里面
hadoop fs -ls -R /
新建成功并成功放入文件后你的第一步就是成功了!
(2)运行本机自带wordcount小demo
hadoop jar /opt/hadoop-2.7.3/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.3.jar wordcount /input /output
其中hadoop jar代表运行jar包文件,后面跟着jar包路径,然后wordcount指的是你的class名,然后是/input 和/output文件夹,输出结果会放在你的/output文件夹下,并且这个output不用你自己新建,但是在下次运行之前要自己删除这个output文件夹,否则下一次运行时会报错,推测是它的机制没有覆盖旧文件的缘故吧。
运行成功大概是这样的:
然后你用命令查看/output文件夹下是否真的是多出了这两个文件
hadoop fs -ls /output/
成功后出出现这两个文件
打开part-r-00000文件后会发现真的统计成功了,好神奇!
这是运行官方的小demo,下一篇我会写运行自己的wordcount小demo