hadoop中的Combiner合并操作

最新推荐文章于 2021-12-18 17:59:07 发布

随缘zzz

最新推荐文章于 2021-12-18 17:59:07 发布

阅读量264

点赞数

分类专栏： shuffle 合并 hadoop 文章标签： hadoop

本文链接：https://blog.csdn.net/weixin_44122269/article/details/106441079

版权

6 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

1 篇文章 0 订阅

订阅专栏

Combiner父类是Reducer

Combiner是在每一个MapTask所在的节点运行，Reducer是接收全局所有Mapper的输出结果

Combiner能够应用的前提是不能影响最终的业务逻辑，在累加的情形下使用，但求平均值的时候不能使用combiner

Combiner的实现过程
1.自定义一个Combiner继承Reducer，重写Reduce方法

public class WordcountCombiner extends Reducer<Text, IntWritable, Text,IntWritable>{
	//逻辑操作
	...
	//写出
	context.write(key,value)

}

2.在job驱动类中设置，job.setCombinerClass(WordcountCombiner.class);

因为combiner和reducer的操作常常一致，所以可以将reducer作为combiner在wordcountDriver驱动类中指定

job.setCombinerClass(WordcountReducer.class);

关注

专栏目录