Mapoutputcollector的几个方法

collect方法

collect方法序列化kv对存储到buffer里面.

  • 首先是各种检查,检查key,value的class
  • 接下来检查分区数量设置是否符合要求
  • 接下检查BufferRemaining是否小于0,小于0就该腾地方了.
  • 就是 startSpill();
    在这里插入图片描述

sortAndSpill方法

在方法里找一下sort.四个参数,m是meta的意思,就是实际先对meta排序的.

 sorter.sort(MapOutputBuffer.this, mstart, mend, reporter);

再找一下write.写到哪里去了,写到partitionOut这里面.

 writer = new Writer<K, V>(job, partitionOut, keyClass, valClass, codec,
                                      spilledRecordsCounter);

mergeParts()方法

找一下merger…

//The output stream for the final single output file
      FSDataOutputStream finalOut = rfs.create(finalOutputFile, true, 4096);
      ```
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值