Word Count-CSDN博客

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
 
//Map阶段：输入的行号作为key,每行读取的值作为value
public class WordCountMapper extends Mapper<LongWritable, Text, Text, IntWritable>{
 
	private Text k  = new Text();
	private IntWritable v = new IntWritable(1);
	
	@Override
	protected void map(LongWritable key, Text value,Context context) throws java.io.IOException, java.lang.InterruptedException {
	     
		// 1 将每次读入的一行进行分割
		String line = value.toString();
		
		// 2 转换成String类型进行分割
		String[] words = line.split(" ");
		
		// 3 将每个键值对都写出
		for (String word : words) {
			String trim = word.trim();
			if(!" ".equals(trim)){
				k.set(trim);
				// 4 map阶段将单词拆分，并不合并，所以固定值为1
				context.write(k, v);
			}
		}
	}
	
}
复制代码

import java.util.Iterator;
 
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;
 
//Reduce阶段是以Map阶段的输出结果作为Reduce阶段的输入数据
public class WordCountReducer extends Reducer<Text, IntWritable, Text, IntWritable>{
 
	
	//同一个key有且仅只执行一次reduce方法
	@Override
	protected void reduce(Text text, Iterable<IntWritable> iterable, Context context) throws java.io.IOException, java.lang.InterruptedException {
	    
		// 1. 将map阶段同一个key对应的value值求和
		int sum = 0;
		Iterator<IntWritable> iterator = iterable.iterator();
		while(iterator.hasNext()){
			 sum += iterator.next().get();
		}
		if(!text.toString().trim().equals("")){
			//将结果输出
			context.write(text, new IntWritable(sum));
		}
	}
	
}
复制代码