浅析Hadoop中MapReduce任务执行流程

MapReduce任务的执行流程非常复杂,但是可以用一个比较粗糙的流程图来描述,描述了一个MapReduce任务从提交到分发和执行完毕的完整过程:



这里要提一下YARN框架,它主要负责的是资源的调度,YARN集群包含两种节点,一种是ResourceManager,这个主要负责资源的管理和调度,一种是NodeManager,这个主要负责任务的运行。

下面把ResourceManager简称为MR,将NodeManager简称为NM,则执行流程可以概括如下:

1、runjar申请执行一个job
2、RM返回Job相关资源提交的路径staging-dir和为本Job产生的jobID
3、提交资源
4、向RM汇报资源提交结果
5、RM将对应的job加入任务队列
6、NM领取任务
7、RM分配运行资源容器到每一个NM
8、RM启动MRAppMaster(在某一个NM上的资源容器)
9、MRAppMaster向RM注册
10、MRAppMaster启动其他NM上的Map进程
11、MRAppMaster启动某个NM上的Reduce进程
12、JOb完成后,MRAPPMaster向RM注销自己 


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值