yarn资源调度
1.yarn的介绍:
yarn是hadoop集群当中的资源管理系统模块,从hadoop2.0开始引入yarn模块,yarn可为各类计算框架提供资源的管理和调度,主要用于管理集群当中的资源(主要是服务器的各种硬件资源,包括CPU,内存,磁盘,网络IO等)以及调度运行在yarn上面的各种任务。
yarn核心出发点是为了分离资源管理与作业监控,实现分离的做法是拥有一个**全局的资源管理(ResourceManager,RM)**,以及每个应用程序对应一个的**应用管理器(ApplicationMaster,AM)**
总结一句话就是说:yarn主要就是为了调度资源,管理任务等
其调度分为两个层级来说:
-
一级调度管理:
计算资源管理(CPU,内存,网络IO,磁盘)
-
二级调度管理:
任务内部的计算模型管理 (AppMaster的任务精细化管理)
yarn的官网文档说明:
http://hadoop.apache.org/docs/r2.7.5/hadoop-yarn/hadoop-yarn-site/YARN.html