Yarn入门详解
一、Yarn概述
Yarn是Hadoop2.0版本引入的集群资源管理系统,直接从MR1演化而来。
我们可以从上图看出Hadoop2.x可以支持其他的分布式计算框架,在引入Yarn的Hadoop2.x之后同一套硬件集群中可以运行多个任务,例如:MR、Spark任务等
Yarn包含三个组件:
- ResourceManager(RM):资源管理
- NodeManager(NM):相当于1.0中的TaskTracker的角色,接收来自RM的请求,分配Container的资源,通过心跳汇报给RM,并且管理节点内部的资源利用情况
- ApplicationMaster(AM):任务调度
严格意义上来说,Yarn只包含两个组件,ResourceManager以及NodeManager。而ApplicationMaster只是一个Yarn的客户端
Yarn将MR1中的JobTracker的资源管理和任务调