本文为传智播客hadoop八天——第四天的学习笔记
目的:将不同文件中单词以文件为单位建立索引。
第一步:输出结果为
hello-->a.txt 3//单词-->文件名
hello-->b.txt 2
hello-->c.txt 4
jerry-->a.txt 1
jerry-->b.txt 1
jerry-->c.txt 2
tom-->a.txt 2
tom-->b.txt 1
tom-->c.txt 2
以下为代码部分
package cn.ii;
import java.io.IOException;
import org.apache.commons.lang.StringUtils;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
imp