Yarn入门简介

Yarn是Hadoop中的一种通用资源管理系统,旨在解决MapReduce的JobTracker单点故障和扩展性问题。它将资源管理和作业调度分离,由ResourceManager和ApplicationMaster负责。NodeManager监控节点资源,Container作为资源抽象进行分配。Yarn的工作流程包括作业提交、初始化、任务分配、运行、状态更新和完成。
摘要由CSDN通过智能技术生成

定义

∙  Yet Another Resource Negotiator —— 另一种资源协调者

∙  通用的资源管理模块,为各类应用程序进行资源管理和调度

 

产生背景

MapReduce本身存在一些问题:

   ∙  JobTracker单点故障问题 —— 如果Hadoop集群的JobTracker挂掉,则整个分布式集群都不能使用了。

   ∙  JobTracker承受的访问压力大,影响系统的扩展性。

   ∙  不支持MapReduce之外的计算框架,比如Storm、Spark、Flink等。

 

MapReduce简介

MapReduce的思想就是“分而治之”,将复杂的任务分解成若干个简单的任务来处理。

 

Yarn核心思想

  将JobTracker的资源管理和作业调度两个功能分开,分别由ResourceManager和ApplicationMaster进程来实现。

                                                                                                  Yarn框架图 

 

Yarn框架

∙  ResourceManager —— 负责集群资源统一管理和计算框架管理,主要包括调度与应用程序管理。RM是系统中将资源分配给每个应用的最终决策者。

∙  NodeManager —— 节点资源管理监控和容器管理。

∙  ApplicationMaster —— 各种计算框架的实现。向RM申请资源,通知NM管理相应资源。

∙  Container —— 资源的一种抽象方式,封装了某个节点上的多维度资源,如内存、CPU、磁盘、网络等。当AM向RM申请资源时,RM为AM返回的资源便是Container。

 

工作原理

  1、作业提交;

  2、作业初始化;

  3、任务分配;

  4、任务运行;

  5、进度及状态更新;

  6、作业完成。

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值