1.首先写一个WordCount.java文件
2.然后进行编译,注意.jar后面的:.
javac -classpath ~/hadoop-0.20.2/hadoop-0.20.2-core.jar:. -d FirstJar WordCount.java
3.打包,注意最后那个.
jar -cvf WordCount.jar -C FirstJar/ .
4.将jar包移到Hadoop目录下
mv WordCount.jar ~/hadoop-0.20.2/
5.接着上传输入文件,输入文件是file01和file02,存放在~/input中
~/hadoop-0.20.2/bin/hadoop dfs -mkdir input
~/hadoop-0.20.2/bin/hadoop dfs -put ~/input/file0* input
6.运行程序,这里要注意,ouput文件夹现在是没有的,程序执行完才有,如果已经有了output文件夹,要删除掉,com.hadoop.wordcount是WordCount.java中的包信息
./bin/hadoop jar WordCount.jar com.hadoop.wordcount.WordCount input output
7.程序执行完,结果在output文件夹中
Bye 1
Goodbye 1
Hadoop 2
Hello 2
World 2