什么是yarn
相当于分布式OS,MR程序相当于操作系统的程序
分类
ResourceManager
- 处理客户端请求,负责接客
- 监控nodemanager
- 启动或监控applicationmanager
- 资源的分配与调度
NodeManager
- 管理单个节点上的资源
- 处理来自ResourceManager的命令
- 处理来自ApplicationMaster的命令
ApplicationMaster
- 作业的老大
- 为应用程序申请资源
- 任务的监控和容错,比如maptask和reducetask监控
Container
- 节点上的容器
- 一个节点上可以有多个容器
yarn工作机制
- 客户端提交任务到ResourceManager,RM让客户端job放到HDFS指定路径上
- RM中产生一个任务,放到一个FIFO队列
- 当有了空闲nodeManager后,就领走任务,创建一个容器
- 容器里中有个对应的ApplicationMaster,