Hadoop yarn资源调度——主要组件及介绍

yarn的概述:

yarn是hadoop集群当中的资源管理系统模块,从hadoop2.x开始引入yarn来进行管理集群当中的资源(主要是服务器的各种硬件资源,包括CPU,内存,磁盘,网络IO等)以及运行在yarn上面的各种任务。
yarn主要就是为了调度资源,管理任务等。其调度分为两个层级来说:
一级调度管理:
计算资源管理
App生命周期管理
二级调度管理:
App内部的计算模型管理
多样化的计算模型

yarn的主要组件

各个组件介绍
ResourceManager:

yarn集群的主节点,主要用于接收客户端提交的任务,并对任务进行分配。
在每个集群中,仅有一个,负责集群资源的统一管理和调度。

NodeManager:

yarn集群的从节点,主要用于任务的计算。
每个节点都有一个,负责单节点资源管理和调度。

ApplicationMaster:

当有新的任务提交到ResourceManager的时候,ResourceManager会在某个从节点nodeManager上面启动一个ApplicationMaster进程,负责这个任务执行的资源的分配,任务的生命周期的监控等

Container:

资源的分配单位,ApplicationMaster启动之后,与ResourceManager进行通信,向ResourceManager提出资源申请的请求,然后ResourceManager将资源分配给ApplicationMaster,这些资源的表示,就是一个个的container.


其他服务:
JobHistoryServer:这是yarn提供的一个查看已经完成的任务的历史日志记录的服务,我们可以启动jobHistoryServer来观察已经完成的任务的所有详细日志信息
TimeLineServer:hadoop2.4.0以后出现的新特性,主要是为了监控所有运行在yarn平台上面的所有任务(例如MR,Storm,Spark,HBase等等)

yarn当中各个主要组件的作用

resourceManager主要作用:

处理客户端请求
启动/监控ApplicationMaster
监控NodeManager
集群的资源分配与调度

NodeManager主要作用:

单个节点上的资源分配与任务调度
接收并处理来自resourceManager的命令
接收并处理来自ApplicationMaster的命令
管理抽象容器container
定时向RM汇报本节点资源使用情况和各个container的运行状态

ApplicationMaster主要作用:

数据切分
为应用程序申请资源
任务监控与容错
负责协调来自ResourceManager的资源,开通NodeManager监视容的执行和资源使用(CPU,内存等的资源分配)

Container主要作用:

对任务运行环境的抽象
任务运行资源(节点,内存,cpu)
任务启动命令
任务运行环境

yarn的官网文档

http://hadoop.apache.org/docs/r2.7.5/hadoop-yarn/hadoop-yarn-site/YARN.html

yarn监控界面

yarn集群的监控管理界面:
http://node01:8088/cluster
jobHistoryServer查看界面:
http://node01:19888/jobhistory

  • 2
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值