利用shuffle,整合相同的key
数据:
北京-天津 2019-09-03
北京-天津 2019-09-03
北京-烟台 2019-09-04
北京-哈尔滨 2019-09-03
北京-成都 2019-09-03
北京-成都 2019-09-03
北京-三亚 2019-09-04
结果集:
北京-天津 2019-09-03
北京-烟台 2019-09-04
北京-哈尔滨 2019-09-03
北京-成都 2019-09-03
北京-三亚 2019-09-04
package MR;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.