说明:eclipse4.5 hadoop2.6 ubuntu。 事先已经在eclipse中配置了hadoop的插件
我们可以用命令直接使用hadoop安装路径中的example下的woedconnt来统计单词的格式。但是我们为了了解hadoop统计单词的过程,就需要对它的源码进行分析。
hadoop的核心就是HDFS和MapReduce。下面让我们来看看hadoop单词统计的代码。
<span style="font-family:Microsoft YaHei;font-size:14px;">import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.had