Hadoop MapReduce Shuffle机制之Combiner合并 | 水一篇博客

Hadoop中的MapReduce是一种编程模型,用于大规模数据集的并行运算
在这里插入图片描述
下面的连接是我的MapReduce系列博客~配合食用效果更佳!

Combiner合并机制

  • Combiner合并也属于Shuffle机制
  • Combiner的父类是Reducer
  • CombinerReducer的区别在于运行时的位置
    • Combiner是在每一个MapTask所在的节点运行的
    • Reducer接收全局所有Mapper的输出结果
  • Combiner的意义就是对每一个MapTask的输出进行局部汇总,主要目的是为了减小网络的传输量
  • 并不是所有的场景都能适用Combiner,一般主要用于求和操作

实现Combiner的步骤就是继承Reducer,最后在Driver类通过setCombinerClass(类.class)设置进去就好了

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值