流程
- client向resource manager提交任务job
- RM返回任务的提交路径以及job的id
- client将任务资源提交到公共文件池中,并向RM汇报提交结果。
- RM将任务放入内部的任务队列中
- Node Manager通过心跳连接,获取到任务
- RM为任务创建执行容器
- RM为容器启动app Master进程
- app Master决定在哪些数据节点上执行任务。
- 被分配执行任务的节点去公共文件池中获取资源文件,执行任务。
- 任务执行完后,app Master向RM注销自己,回收资源。
Yarn中的重要组件与作用
Resource Manager
负责集群中资源的分配,app master进程的启动创建,监控app master与 node manager的状态。
Application Master
每一个job有一个app master,负责任务的具体执行,报告任务执行状况
Node Manager
负责启动和管理节点中的容器。