ReduceTask工作机制源码解析



1.  在LocalJobRunner$Job中的run()方法中
    try {
          if (numReduceTasks > 0) {
        //根据reduceTask的个数,创建对应个数的LocalJobRunner$Job$ReduceTaskRunnable
            List<RunnableWithThrowable> reduceRunnables = getReduceTaskRunnables(
                jobId, mapOutputFiles);
       // 线程池
            ExecutorService reduceService = createReduceExecutor();
        //将 ReduceTaskRunnable提交给线程池执行
            runTasks(reduceRunnables, reduceService, "reduce");
          }
    
     1) . 执行    LocalJobRunner$Job$ReduceTaskRunnable 中的run方法
        
    (1) . ReduceTask reduce = new ReduceTask(systemJobFile.toString(),
              reduceId, taskId, mapIds.size(), 1);
          //创建ReduceTask对象
        (2) . reduce.run(localConf, Job.this); // 执行ReduceTask的run方法
          <1> . runNewReducer(job, umbilical, reporter, rIter, comparator,
                    keyClass, valueClass);
            [1] . org.apache.hadoop.mapreduce.TaskAttemptContext taskContext = TaskAttemptContextImpl
            [2] . org.apache.hadoop.mapreduce.Reducer<INKEY,INVALUE,OUTKEY,OUTVALUE> reducer = WordCountReducer
            [3] . org.apache.hadoop.mapreduce.RecordWriter<OUTKEY,OUTVALUE> trackedRW = ReduceTask$NewTrackingRecordWriter
            [4] . reducer.run(reducerContext);
                  //执行WordCountReducer的run方法 ,实际执行的是WordCountReducer继承的Reducer类中的run方法.
              {1} .reduce(context.getCurrentKey(), context.getValues(), context);
                   //执行到WordCountReducer中的 reduce方法.
                          {2} . context.write(k,v) 将处理完的kv写出.
                >>1 . reduceContext.write(key, value);
                >>2 . output.write(key, value);
                >>3 . real.write(key,value);  // 通过RecordWriter将kv写出
                >>4 . out.write(NEWLINE);  //通过输出流将数据写到结果文件中

 

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值