MapReduce之job提交


接下来讲解的是前一篇博客(MapReduce 流程介绍)中的1-3步job的提交!!可以用之前写的wordcount案例来调试

1.Job提交流程源码简介(重要代码提取)

//自定义代码中的job.waitForCompletion()
waitForCompletion()

submit();

// 1建立连接
	connect();	
		// 1)创建提交Job的代理
		new Cluster(getConfiguration());
			// (1)判断是本地yarn还是远程
			initialize(jobTrackAddr, conf); 

// 2 提交job
submitter.submitJobInternal(Job.this, cluster)
	// 1)创建给集群提交数据的Stag路径
	Path jobStagingArea = JobSubmissionFiles.getStagingDir(cluster, conf);

	// 2)获取jobid ,并创建Job路径
	JobID jobId = submitClient.getNewJobID();

	// 3)拷贝jar包到集群
copyAndConfigureFiles(job, submitJobDir);	
	rUploader.uploadFiles(job, jobSubmitDir);

// 4)计算切片,生成切片规划文件
writeSplits(job, submitJobDir);
		maps = writeNewSplits(job, jobSubmitDir);
		input.getSplits(job);

// 5)向Stag路径写XML配置文件
writeConf(conf, submitJobFile);
	conf.writeXml(out);

// 6)提交Job,返回提交状态
status = submitClient.submitJob(jobId, submitJobDir.toString(), job.getCredentials());

2.图解

在这里插入图片描述

3.个人总结

job提交个人认为记忆点分为3点分别为

3.1.提交协议(判断是Yarn还是本地)

对应源码 =》initialize(jobTrackAddr, conf);

3.2.创建路径(指定提交到文件存放路径)

对应源码 =》JobSubmissionFiles.getStagingDir(cluster, conf);

3.3.提交文件

①提交split文件(切片信息,决定了开多少个MapTask)
②提交xml文件(指定按照配置去运行)
③提交jar文件(具体运行源代码)

版权声明:本博客为记录本人自学感悟,转载需注明出处!
https://me.csdn.net/qq_39657909

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值