出生
YARN(Yet Another Resource Negotiator)出生于MapReduce 2.0,是在Hadoop1.0升级到Hadoop2.0的过程中从MapReduce 1.0 中独立出来的,纯粹的资源管理调度框架。
MapReduce1.0既是一个计算框架,同时又负责资源的管理和调度任务,当升级到MapReduce2.0后,原有的资源管理和调度功能独立出来形成了YARN,因此升级后的MapReduce2.0是运行在YARN上的一个纯粹的计算框架。
【下图是YARN的架构设计思路图】
作用&优点
作用
负责集群中资源的统一管理和调度,实现集群资源共享和资源弹性收缩;
可支持多种不同的计算框架:MapReduce(离线批处理)、Spark(内存计算框架)、Tez(DAG计算框架)、Storm(流计算框架)等;
优点
1、提升了集群的资源利用率;
2、协调资源,减少不同作业和不同系统之间的资源争抢;
3、增强系统扩展性(基于分布式系统本身的特性);
4、降低企业的运维成本;