【Hadoop】MapReduce Job Submission Files - 代码描述

最新推荐文章于 2021-03-25 17:49:46 发布

天外有菌

最新推荐文章于 2021-03-25 17:49:46 发布

阅读量1.2k

点赞数

分类专栏： Hadoop 文章标签： Hadoop

本文链接：https://blog.csdn.net/zhangjun2915/article/details/9336949

版权

Hadoop 专栏收录该内容

19 篇文章 0 订阅

订阅专栏

Copy Job jar File

org.apache.hadoop.mapred.JobClient.submitJobInternal() --> copyAndConfigureFiles()

    String originalJarPath = job.getJar();

    //junz-20130713: Copy job jar file to JT's file system
    if (originalJarPath != null) {           // copy jar to JobTracker's fs
      // use jar name if job is not named. 
      if ("".equals(job.getJobName())){
        job.setJobName(new Path(originalJarPath).getName());
      }
      Path submitJarFile = JobSubmissionFiles.getJobJar(submitJobDir);
      job.setJar(submitJarFile.toString());
      fs.copyFromLocalFile(new Path(originalJarPath), submitJarFile);
      fs.setReplication(submitJarFile, replication);
      fs.setPermission(submitJarFile, 
          new FsPermission(JobSubmissionFiles.JOB_FILE_PERMISSION));
    }

Generate InputSplit

org.apache.hadoop.mapred.JobClient.submitJobInternal() --> writeSplits() --> writeNewSplits()

    InputFormat<?, ?> input =
      ReflectionUtils.newInstance(job.getInputFormatClass(), conf);

    List<InputSplit> splits = input.getSplits(job);
    T[] array = (T[]) splits.toArray(new InputSplit[splits.size()]);

    // sort the splits into order based on size, so that the biggest
    // go first
    Arrays.sort(array, new SplitComparator());

Write Split Files

JobClient.submitJobInternal() --> writeSplits() --> writeNewSplits() --> JobSplitWriter.createSplitFiles()

    FSDataOutputStream out = createFile(fs, 
        JobSubmissionFiles.getJobSplitFile(jobSubmitDir), conf);
    SplitMetaInfo[] info = writeNewSplits(conf, splits, out);
    out.close();
    writeJobSplitMetaInfo(fs,JobSubmissionFiles.getJobSplitMetaFile(jobSubmitDir), 
        new FsPermission(JobSubmissionFiles.JOB_FILE_PERMISSION), splitVersion,
        info);

Write Job Config File

JobClient.submitJobInternal()

          FSDataOutputStream out = 
            FileSystem.create(fs, submitJobFile,
                new FsPermission(JobSubmissionFiles.JOB_FILE_PERMISSION));

          try {
            jobCopy.writeXml(out);
          } finally {
            out.close();
          }