MapReduce中计算Wordcount中map端及reduce端的设置

最新推荐文章于 2024-01-11 16:12:06 发布

道法—自然

最新推荐文章于 2024-01-11 16:12:06 发布

阅读量228

点赞数

分类专栏： MapReduce 大数据开发面试数据库部分面试部分大数据面试总结

本文链接：https://blog.csdn.net/wyqwilliam/article/details/84669574

版权

map端的设置：

package wordcount;

import java.io.IOException;
import java.util.StringTokenizer;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

public class MyMapper extends  Mapper<LongWritable, Text, Text, IntWritable> {
	private final static IntWritable one = new IntWritable(1);
	private Text word = new Text();
	public void map(Object Key, Text value, Context context) throws IOException, InterruptedException {
		StringTokenizer itr  = new StringTokenizer(value.toString());
		while (itr.hasMoreTokens()) {
			word.set(itr.nextToken());
			context.write(word, one);
		}
	}
}

map端主要是将输入进来的数值转换成（key，1）的形式

reduce端的设置：

package wordcount;

import java.util.Iterator;

import org.apache.hadoop.io.IntWritable

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

道法—自然

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
MapReduce中计算Wordcount中map端及reduce端的设置

map端的设置： package wordcount;import java.io.IOException;import java.util.StringTokenizer;import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hado...
复制链接

扫一扫