通过一个小程序,理解mapReduce的逻辑,以及函数方法运行的机制。
虽然例子举得不太好,看完有种没必要的感觉,但是有助于新手理解mapreduce。
不讲原理,只讲代码和逻辑。
求班级内年龄最大的姓名和年龄:
file1:
file2:小明 13
小强 14
小红 12
file3:小蓝 20
小白 15
小青 10
小黑 23
等等等等。。。
代码:
package com.ming.blog;
import java.io.IOException;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
im