1、YARN相关角色说明
YARN是 Hadoop资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。
YARN主要包括几种角色:
ResourceManager(RM):
主要接收客户端任务请求,接收和监控NodeManager(NM)的资源情况汇报,负责资源的分配与调度,启动和监控ApplicationMaster(AM),一个JOB在集群只有一个AM。
Applications Manager:
应用程序管理器,应用程序管理,它是负责系统中所有的job,包括job的提交与调度器协商资源来启动ApplicationMaster(AM)和监控(AM)运行状态,并且失败的时候能够重新启动它,更新分配给一个新的Container容器的进度或者状态,除了资源它不管,它就负责job 。
Resource Scheduler:
调度器,默认是FIFO先进先出调度模式
NodeManager(NM):
主要是节点上的资源管理,启动Container运行task计算,上报资源、container情况给RM,任务处理情况给AM
Application Master:
主要是单个Application(Job)的task管理和调度,向RM进行资源的申请,一个JOB在集群只有一个AM,向NM发出launch Container指令,接收N