Hadoop系列（二）——灵魂管理者 YARN 详解

最新推荐文章于 2024-11-28 11:49:32 发布

BigData_Hubert

最新推荐文章于 2024-11-28 11:49:32 发布

阅读量1.5w

点赞数 8

CC 4.0 BY-SA版权

分类专栏：大数据文章标签： hadoop 大数据 mapreduce yarn

本文链接：https://blog.csdn.net/BigData_Hobert/article/details/108130861

集群资源管理器 YARN

YARN 简介
YARN 的组件架构
YARN工作流程
常见问题

YARN 简介

YARN（Yet Another Resource Negotiator）是一个通用的资源管理平台，可为各类计算框架提供资源管理和调度。YARN通过其内部的一个全局资源管理器（ResourceManager，RM），以及每个应用程序对应一个的应用管理器（ApplicationMaster，AM）；以Container为单位分配资源为每个应用程序分配一个作业（Job）或者Job的有向无环图（DAG），来达到分离资源管理与作业调度/监控的功能。YARN可以将多种计算框架(如离线处理MapReduce、在线处理的Storm、迭代式计算框架Spark、流式处理框架S4等) 部署到一个公共集群中，共享集群的资源。

Hadoop YARN就好像一个云操作系统灵魂管理者，由一个ResourceManager和多个NodeManager组成。它负责管理所有NodeManger上多维度资源，并以Container(启动一个Container相当于启动一个主进程)方式分配给应用程序启动ApplicationMaster(相当于开启一个进程) 或运行ApplicationMaster切分的各Task任务（子进程的多线程并发操作)。

YARN 的组件架构

YARN的组件结构如下如所示：

在这里插入图片描述
YARN总体上仍然是Master/Slave结构，在整个资源管理框架中，ResourceManager为Master，NodeManager为Slave，ResourceManager负责对各个NodeManager上的资源进行统一管理和调度。当用户提交一个应用程序时，需要提供一个用以跟踪和管理这个程序的ApplicationMaster，它负责向ResourceManager申请资源，并要求NodeManger启动可以占用一定资源的任务。由于不同的ApplicationMaster被分布到不同的节点上，因此它们之间不会相互影响。

从上图可以看出，YARN主要由ResourceManager（包括ApplicationManager和ResourceScheduler）和NodeManager（包括ApplicationMaster和Container）这两个组件构成。下面分别介绍这两个组件的结构和功能：

ResourceManager

resourcemanager是hadoop YARN全局的资源管理器，也是Global（全局）的主进程。

它的功能如下：

与客户端进行交互，处理来自于客户端的请求，如查询应用的运行情况等。
启动和管理各个应用的ApplicationMaster，并且为ApplicationMaster申请第一个Container用于启动和在它运行失败时将它重新启动。
管理NodeManager（NM），接收来自NodeManager的资源和节点健康情况汇报，并向NodeManager下达管理资源命令，例如kill掉某个container。。RM只接受NM的资源回报信息，对于具体的资源处理则交给NM自己处理。
资源管理和调度，接收来自ApplicationMaster的资源申请，并且为其进行分配。这个是它的最重要的职能。

RM是一个全局的资源管理器,负责整个系统的资源管理和分配。它主要由两个组件构成：调度器（Scheduler）和应用程序管理器（Applications Manager，ASM）。