hadoop的combiner函数介绍

最新推荐文章于 2023-06-30 18:45:00 发布

I_belong_to_jesus

最新推荐文章于 2023-06-30 18:45:00 发布

阅读量454

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/fangfanglovezhou/article/details/106236275

版权

大数据专栏收录该内容

11 篇文章 3 订阅

订阅专栏

combiner函数与reduce函数形式相同，但不同之处在于它的输出类型是中间的键值（key,value）对类型，这些中间值最终会输入给reduce函数，map会产生大量本地输入，但map函数不会对键值对做合并，例如统计单词dog的数量：

Map:

dog 1

dog 1

dog 1

dog 1

Map阶段，某个Map执行完毕传给Reduce的参数为dog{1,1,1,1},values中的值为4个，而如果添加combiner函数，其会实现本地相同key的合并，并对map输出key进行排序，因此最终传给reduce的键值对是dog{4},因此这样可以减少map传给reduce的数据数量，这是MapReduce的一种优化手段。

需要注意：combiner与Mapper和Reduced不同，没有默认实现，只有满足结合律才可以，求最大、求和可以，但求平均不可以。即combiner是可插可拔的，绝不能改变最终的结果。故其只能用于Reduce的输入键值对和输出键值对完全一样的情况。

I_belong_to_jesus

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
hadoop的combiner函数介绍

combiner函数与reduce函数形式相同，但不同之处在于它的输出类型是中间的键值（key,value）对类型，这些中间值最终会输入给reduce函数，map会产生大量本地输入，但map函数不会对键值对做合并，例如统计单词dog的数量：Map:dog 1dog 1dog 1dog 1Map阶段，某个Map执行完毕传给Reduce的参数为cat {1,1,1,1},values中的值为4个，而如果添加combiner函数，其会实现本地相同key的合并，并对map输出key进行排序，
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。