Hadoop -- Yarn资源调度器

最新推荐文章于 2023-05-08 07:30:00 发布

火成哥哥

最新推荐文章于 2023-05-08 07:30:00 发布

阅读量216

点赞数

分类专栏： Hadoop 文章标签： java hadoop spark mapreduce 分布式

本文链接：https://blog.csdn.net/a1786742005/article/details/104591404

版权

Hadoop 专栏收录该内容

44 篇文章 4 订阅

订阅专栏

一、Yarn 介绍

Yarn 是 hadoop 的一个资源调度平台，负责为运算程序提供服务器运算资源，相当于一个分布式的操作系统平台，而 MapReduce 等运算程序则相当于运行于操作系统之上的应用程序。

二、Yarn 基本架构

YARN 主要由 ResourceManager、NodeManager、ApplicationMaster 和 Container 等组件构成。
在这里插入图片描述

三、Yarn 工作机制

1、图示
在这里插入图片描述
2、工作机制详解
(1) MR 程序提交到客户端所在的节点。
(2) YarnRunner 向 ResourceManager 申请一个 Application。
(3) RM 将该应用程序的资源路径返回给 YarnRunner。
(4) 该程序将运行所需资源提交到 HDFS 上。
(5) 程序资源提交完毕后，申请运行 mrAppMaster。
(6) RM 将用户的请求初始化成一个 Task。
(7) 其中一个 NodeManager 领取到 Task 任务。
(8) 该 NodeManager 创建容器 Container ，并产生 MRAppmaster。
(9) Container 从 HDFS 上拷贝资源到本地。
(10) MRAppmaster 向 RM 申请运行 MapTask 资源。
(11) RM 将运行 MapTask 任务分配给另外两个 NodeManager，另两个 NodeManager 分别领取任务并创建容器。
(12) MR 向两个接收到任务的 NodeManager 发送程序启动脚本，这两个 NodeManager 分别启动 MapTask，MapTask 对数据分区排序。
(13) MrAppMaster 等待所有 MapTask 运行完毕后，向 RM 申请容器，运行 ReduceTask。
(14) ReduceTask 向 MapTask 获取相应分区的数据。
(15) 程序运行完毕后，MR 会向 RM 申请注销自己。

四、YARN 作业提交全过程

在这里插入图片描述
作业提交的全过程详解：
1、作业提交
第1步：Client 调用 job.waitForCompletion 方法，向整个集群提交 MapReduce 作业。
第2步：Client 向 RM 申请一个作业 id。
第3步：RM 给 Client 返回该 job 资源的提交路径和作业 id。
第4步：Client 提交 jar 包、切片信息和配置文件到指定的资源提交路径。
第5步：Client 提交完资源后，向 RM 申请运行 MrAppMaster。

2、作业初始化
第6步：当 RM 收到 Client 的请求后，将该 job 添加到容量调度器中。
第7步：某一个空闲的 NM 领取到该 Job。
第8步：该 NM 创建 Container，并产生 MRAppmaster。
第9步：下载 Client 提交的资源到本地。

3、任务分配
第10步：MrAppMaster 向 RM 申请运行多个 MapTask 任务资源。
第11步：RM 将运行 MapTask 任务分配给另外两个 NodeManager，另两个 NodeManager 分别领取任务并创建容器。

4、任务运行
第12步：MR 向两个接收到任务的 NodeManager 发送程序启动脚本，这两个 NodeManager 分别启动MapTask，MapTask 对数据分区排序。
第13步：MrAppMaster 等待所有 MapTask 运行完毕后，向 RM 申请容器，运行 ReduceTask。
第14步：ReduceTask 向 MapTask 获取相应分区的数据。
第15步：程序运行完毕后，MR 会向 RM 申请注销自己。

5、进度和状态更新
YARN 中的任务将其进度和状态(包括 counter)返回给应用管理器, 客户端每秒(通过mapreduce.client.progressmonitor.pollinterval设置)向应用管理器请求进度更新, 展示给用户。

6、作业完成
除了向应用管理器请求作业进度外, 客户端每5秒都会通过调用 waitForCompletion() 来检查作业是否完成。时间间隔可以通过 mapreduce.client.completion.pollinterval 来设置。作业完成之后, 应用管理器和 Container 会清理工作状态。作业的信息会被作业历史服务器存储以备之后用户核查。

五、资源调度器

目前，Hadoop 的作业调度器主要有三种：FIFO、Capacity Scheduler 和 Fair Scheduler。Hadoop 2.7.2 默认的资源调度器是 Capacity Scheduler。
具体设置在：yarn-default.xml 文件

<property>
    <description>The class to use as the resource scheduler.</description>
    <name>yarn.resourcemanager.scheduler.class</name>
	<value>org.apache.hadoop.yarn.server.resourcemanager.scheduler.capacity.CapacityScheduler</value>
</property>

1、先进先出调度器(FIFO)
在这里插入图片描述
2、容量调度器(Capacity Scheduler)

3、公平调度器(Fair Scheduler)

六、任务的推测执行

1、作业完成时间取决于最慢的任务完成时间
一个作业由若干个 Map 任务和 Reduce 任务构成。因硬件老化、软件 Bug 等，某些任务可能运行非常慢。
思考：系统中有99%的Map任务都完成了，只有少数几个Map老是进度很慢，完不成，怎么办？

2、推测执行机制
发现拖后腿的任务，比如某个任务运行速度远慢于任务平均速度。为拖后腿任务启动一个备份任务，同时运行。谁先运行完，则采用谁的结果。

3、执行推测
(1) 每个 Task 只能有一个备份任务
(2) 当前 Job 已完成的 Task 必须不小于 0.05
(3) 开启推测执行参数设置。mapred-site.xml 文件中默认是打开的。

<property>
  	<name>mapreduce.map.speculative</name>
  	<value>true</value>
  	<description>If true, then multiple instances of some map tasks may be executed in parallel.</description>
</property>

<property>
  	<name>mapreduce.reduce.speculative</name>
  	<value>true</value>
  	<description>If true, then multiple instances of some reduce tasks may be executed in parallel.</description>
</property>

4、不能启动推测执行机制情况
(1) 任务间存在严重的负载倾斜
(2) 特殊任务，比如任务向数据库中写数据

5、算法原理
在这里插入图片描述

火成哥哥

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop -- Yarn资源调度器

一、Yarn 介绍Yarn 是 hadoop 的一个资源调度平台，负责为运算程序提供服务器运算资源，相当于一个分布式的操作系统平台，而 MapReduce 等运算程序则相当于运行于操作系统之上的应用程序。二、Yarn 基本架构YARN 主要由 ResourceManager、NodeManager、ApplicationMaster 和 Container 等组件构成。三、Yarn 工作...
复制链接

扫一扫