Apache Hadoop YARN (Yet Another Resource Negotiator,另一种资源协调者)是一种新的 Hadoop 资源管理器,它是一个通用资源管理系统,可为上层应用提供统一的资源管理和调度,它的引入为集群在利用率、资源统一管理和数据共享等方面带来了巨大好处。
YARN的基本思想是将JobTracker的两个主要功能(资源管理和作业调度/监控)分离,主要方法是创建一个全局的ResourceManager(RM)和若干个针对应用程序的ApplicationMaster(AM)。这里的应用程序是指传统的MapReduce作业或作业的DAG(有向无环图)。
将JobTracker和TaskTracker进行分离,它由下面几大构成组件:
- 一个全局的资源管理器 ResourceManager
- ResourceManager的每个节点代理 NodeManager
- 表示每个应用的 ApplicationMaster
- 每一个ApplicationMaster拥有多个Container在NodeManager上运行
更详细的Yarn讲解:https://baike.baidu.com/item/yarn/16075826
搭建Yarn环境
上一篇博客讲了如何搭建Hadoop平台。Yarn的搭建是在Hadoop的基础上的
可以通过配置以下Yarn的信息,另外运行ResourceManager守护进程和NodeManager守护进