Job提交流程源码解析

最新推荐文章于 2023-05-24 11:17:31 发布

鸿儒之观

最新推荐文章于 2023-05-24 11:17:31 发布

阅读量267

点赞数 1

分类专栏：大数据

本文链接：https://blog.csdn.net/zhijunming/article/details/107640103

版权

大数据专栏收录该内容

18 篇文章 1 订阅

订阅专栏



1. job.waitForCompletion(true); 在Driver中提交job
   1) sumbit() 提交
    (1) connect():
        <1>  return new Cluster(getConfiguration());
             ① initialize(jobTrackAddr, conf);  
            通过YarnClientProtocolProvider | LocalClientProtocolProvider  根据配置文件的参数信息
            获取当前job需要执行到本地还是Yarn
            最终:LocalClientProtocolProvider  ==> LocalJobRunner


        (2) return submitter.submitJobInternal(Job.this, cluster); 提交job
        
        <1> . checkSpecs(job); 检查job的输出路径。
        <2> . Path jobStagingArea = JobSubmissionFiles.getStagingDir(cluster, conf);
              生成Job提交的临时目录
          D:\tmp\hadoop\mapred\staging\Administrator1777320722\.staging
        <3> . JobID jobId = submitClient.getNewJobID();  为当前Job生成Id
        <4> . Path submitJobDir = new Path(jobStagingArea, jobId.toString());  Job的提交路径
              d:/tmp/hadoop/mapred/staging/Administrator1777320722/.staging/job_local1777320722_0001
        <5> . copyAndConfigureFiles(job, submitJobDir);
          ① rUploader.uploadResources(job, jobSubmitDir);
             [1] uploadResourcesInternal(job, submitJobDir);  
                 {1}.submitJobDir = jtFs.makeQualified(submitJobDir);
                 mkdirs(jtFs, submitJobDir, mapredSysPerms);
                 创建Job的提交路径
       <6> . int maps = writeSplits(job, submitJobDir); //生成切片信息 ，并返回切片的个数
       <7> . conf.setInt(MRJobConfig.NUM_MAPS, maps);  //通过切片的个数设置MapTask的个数
       <8> . writeConf(conf, submitJobFile);  //将当前Job相关的配置信息写到job提交路径下

             路径下:  job.split  job.splitmetainfo  job.xml    xxx.jar
        <9> .status = submitClient.submitJob(
                 jobId, submitJobDir.toString(), job.getCredentials());
                //真正提交Job
       <10> .  jtFs.delete(submitJobDir, true);  //等job执行完成后，删除Job的临时工作目录的内容

鸿儒之观

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Job提交流程源码解析

1. job.waitForCompletion(true); 在Driver中提交job 1) sumbit() 提交 (1) connect(): <1> return new Cluster(getConfiguration()); ① initialize(jobTrackAddr, conf); 通过YarnClientProtocolProvider | LocalClientProtocol...
复制链接

扫一扫