combiners 进行map端的reduce

最新推荐文章于 2020-05-30 11:13:44 发布

mrwang

最新推荐文章于 2020-05-30 11:13:44 发布

阅读量446

点赞数

分类专栏： hadoop

本文链接：https://blog.csdn.net/zxnm55/article/details/19040225

版权

hadoop 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

combiners
是在map端进行的一个reduce阶段

如

wordCount 程序

节点1map输出

hello 1

hadoop 1

hello 1

节点2map输出

hello 1

hadoop 1

通过combiners 就可以进行预先的聚合

变成节点1 <hadoop，[1]>, <hello,[3]>

节点2 <hadoop, [2]>, <hello, [1]>到reduce

就不会节点每个单词就输出一遍减少数据流量

这在性能上能够大大提高

因为等待网络传输数据数据读取写入是需要很大代销的减少代销很重要

由于在wordCount 中做combiners 是跟reduce 一样的可以直接使用reduce 类去进行 combiners

job.setCombinerClass(ReducerClass.class);

但是值得注意的是

如果用来计算平均值就需要注意

打个比方

（1+2+3+4+5+6+7+8+9）/9 = 5

如果第一个节点计算的是

（1+2+3+4+5）/5 = 3

节点2 计算余下部分

（6+7+8+9）/4 = 7

reduce 3+7 = 10

计算就会出错要特别注意这点

本文出自 “某人说我技术宅” 博客，请务必保留此出处http://1992mrwang.blog.51cto.com/3265935/1206352

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

mrwang

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
combiners 进行map端的reduce

combiners 是在map端进行的一个reduce阶段如wordCount 程序节点1map输出hello 1hadoop 1hello 1hello 1节点2map输出hello 1hadoop 1hadoop 1通过combiners 就可以进行预先的聚合变成节点1 , 节点2 , 到reduce就不会节点每个单词就输出一遍减少数据流
复制链接

扫一扫