【大数据之Hadoop】十四、MapReduce之Combiner合并

最新推荐文章于 2023-10-16 22:07:05 发布

阿宁呀

最新推荐文章于 2023-10-16 22:07:05 发布

阅读量444

点赞数

分类专栏： hadoop 文章标签： hadoop 大数据 mapreduce

本文链接：https://blog.csdn.net/qq_18625571/article/details/129846898

版权

hadoop 专栏收录该内容

37 篇文章 8 订阅

订阅专栏

在这里插入图片描述
Combiner是Mapper和Reducer之间的组件，其组件的父类是Reducer。

Combiner和Reducer的区别：
Combiner是运行在每一个MapTask所在的节点，即对每一个MapTask的输出进行局部汇总，减少网络传输量。
Reducer则是接收全局是Mapper的输出结果。
Combiner应用前提是不能影响最终的业务逻辑，且Combiner的输出kv对应Reducer输入kv。

方法一、自定义Combiner

创建一个新Combiner类继承Reducer类，重写reduce()方法，与Reducer类中的写法相同。
在驱动类Driver中指定combiner

// 指定需要使用combiner，以及用哪个类作为combiner的逻辑
job.setCombinerClass(WordCountCombiner.class);

方法二、把WordcountReducer作为Combiner在WordcountDriver驱动类中指定

// 指定需要使用Combiner，以及用哪个类作为Combiner的逻辑
job.setCombinerClass(WordCountReducer.class);

在这里插入图片描述

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

阿宁呀

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【大数据之Hadoop】十四、MapReduce之Combiner合并

方法二、把WordcountReducer作为Combiner在WordcountDriver驱动类中指定。Combiner是Mapper和Reducer之间的组件，其组件的父类是Reducer。，且Combiner的输出kv对应Reducer输入kv。Reducer则是接收全局是Mapper的输出结果。是运行在每一个MapTask所在的节点，即。方法一、自定义Combiner。
复制链接

扫一扫