Mapreduce中Combiner的使用及误区

combine可以理解为是在map端的reduce的操作 对单个map任务的输出结果数据进行合并的操作
作用:
减少传输到Reduce中的数据量。它主要是为了削减Mapper的输出从而减少网络带宽和Reducer之上的负载
缺点:
combine是作为一个优化手段,可选项,不是所有的MR程序都适合combine
适合的场景:比如求最大值,求和,不适合比如求中间值

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值