MapReduce 计算流程和job提交流程

一.MapReduce 计算流程

在这里插入图片描述

1 首先是通过程序员所编写的MR程序通过命令行本地提交或者IDE远程提交

2 一个MR程序就是一个Job,Job信息会给Resourcemanger,向Resourcemanger注册信息

3 在注册通过后,Job会拷贝相关的资源信息(从HDFS中)

4 紧接着会向Resourcemanger提交完整的Job信息(包括资源信息)

5a Resourcemanger 会通过提交的Job信息,计算出Job所需的资源,为Job分配Container资源

5b 计算资源会分发给对应的NodeManger,NodeManager会创建一个MRAppMaster

6 MRAppMaster初始化Job

7 获取输入切片信息

8 MRAppMaster向ResourceManager 请求资源

9a 启动计算资源(连接到对应的资源所在NodeManager)

9b 启动YARN Child

10 从文件系统中获取完整的Job信息

11 启动对应的Maptask或者ReduceTask 进程,执行计算。

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-P6qO3erJ-1570629607821)(D:/%E5%A4%A7%E6%95%B0%E6%8D%AE/Note/Day02-Hadoop/assets/1568950626404.png)]

二 Job 提交流程(重点)

在这里插入图片描述

(1)建立连接

判断是在本地运行还是集群运行,分别会创建不同的运行对象 YARN | Local

(2)提交Job

1)校验空间 checkSpecs()

在这里插入图片描述
在这里插入图片描述

2)缓存处理

在这里插入图片描述

3)创建资源路径 Staging路径

在这里插入图片描述

4)获取Job ID ,在Staging路径下创建Job路径

在这里插入图片描述

5)拷贝相关资源到jobID路径
files
libjars
archives
jobJar

在这里插入图片描述

6)计算切片 生成切片规划文件

切片是一个逻辑上的概念,不会文件进行实际物理拆分,默认切分为128MB(本地为32MB)
在这里插入图片描述
在这里插入图片描述

7)向Staging路径写XML 配置文件

在这里插入图片描述

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值