MapReduce之Combiner合并

  • Combiner是MR程序中Mapper和Reducer之外的一种组件(本质是一个Reducer类)

  • Combinr组件的父类就是Reducer

  • Conbimer只有在驱动类里设置了之后,才会运行
    在这里插入图片描述

  • Combiner和Reducer的区别在于运行的位置:
    map----sort—copy—sort(shuffle阶段)—reduce

  1. ==Combiner是在每一个MapTask所在的节点运行
  2. Reducer是接收全局所有Mapper的输出结果==
  • Combiner的意义就是对每一个MapTask的输出进行局部汇总,以减小网络传输量(减少磁盘IO和网络IO)

  • Cormbiner能多应用的前提是不能影响最终的业务逻辑,而且,Combiner的输出kv应该跟Reducer的输入kv类型要对应起来。 Combiner用在加减操作的场景,不能用在乘除操作的场景
    比如:
    在这里插入图片描述

  • Combiner既有可能在MapTask端调用:
    ①每次溢写前会调用Combiner对溢写的数据进行局部合并
    ②在merge时,如果溢写的片段数>=3,如果设置了Combiner,Combiner会再次对
    数据进行Combine!

  • Combiner既有可能在ReduceTask端调用:
    ③shuffle线程拷贝多个MapTask同一分区的数据,拷贝后执行merge和sort,
    如果数据量过大,需要将部分数据先合并排序后,溢写到磁盘!
    如果设置了Combiner,Combiner会再次运行!

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

孙晨c

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值