MapReduce在YARN上的的工作机制

本文详细介绍了MapReduce在YARN上的执行过程,包括作业的提交、初始化、运行阶段和完成阶段。在初始化阶段,客户端提交作业,资源管理器启动Application Master,分配任务并初始化。运行阶段涉及任务执行和进度更新。最后,Application Master接收到任务完成通知,作业完成。
摘要由CSDN通过智能技术生成

Mapreduce在YARN上的过程概述

首先我们对整个mpred的过程有个初步的理解。
首先,我们在客户节点上提交mapred程序,也就是向资源管理器提交作业。
其次,资源管理器对任务进行初始化和分配。
分配任务之后,任务开始在特定节点上的制定容器执行,并向MRapplicationManager更新进度。
最后,application master收到作业完成的或者是薄的通知,并通知客户端。清理容器和工作状态之后,整个作业完成。
其中提到的一些概念,比如application master,我们会在下面提及。
Hadoop提供一个Job类管理和配置各个过程。
我们按照上面的过程划分,分开来谈。
在这里插入图片描述

part0 顶层应用

在整个过程中,有 5 个主要的独立实体

  1. 客户端:提交mapred作业
  2. YARN 资源管理器
  3. YARN 节点管理器
  4. MapReduce的 application master ,这个实体负责协调各个任务的运行,他在由节点管理器管理的节点中运行。
  5. 分布式文件系统,也就是HDFS,负责共享文件

part1 初始化阶段

1.提交作业:

我们通过 Job 对象向资源管理器提交申请,提交过程如下

<
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值