Yarn工作原理浅析

本文介绍了Yarn在Hadoop中的作用,作为资源调度框架,Yarn包含ResourceManager、NodeManager和Application Master等关键组件。ResourceManager负责全局资源管理和调度,NodeManager管理节点资源,Application Master则协调作业执行。作业执行流程涉及Client提交作业、ResourceManager分配Container、启动Application Master以及Application Master申请和分配任务资源。通过理解这些概念和流程,能更好地掌握Hadoop集群作业处理。
摘要由CSDN通过智能技术生成

    Yarn作为Hadoop的资源调度框架,承担着扩展Hadoop的重要责任,我们配置Spark时就使用了Spark on Yarn的配置方法,这里简单介绍一些YARN的工作原理,有助于理解整个系统处理作业的过程。

    在配置好的Hadoop环境中,我们输入jps查看进程,可以看到,master节点上的ResourceManager和slave节点上的NodeManager就是属于Yarn的进程。

几个需要了解的概念

1. ResourceManager

    ResourceManager是master上的进程,负责整个分布式系统的资源管理和调度。他会处理来自client端的请求(包括提交作业/杀死作业);启动/监控Application Master;监控NodeManager的情况,比如可能挂掉的NodeManager。

2. NodeManager

    相对应的,NodeManager时处在slave节点上的进程,他只负责当前slave节点的资源管理和调度,以及task的运行。他会定期向ResourceManager回报资源/Container的情况(heartbeat);接受来自ResourceManager对于Container的启停命令。

3. Applicatio

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值