Yarn简单工作机制
图片分析
文字描述
- Job提交,生成YarnRunner
- YarnRunner向RM申请一个AP
- RM返回给YarnRunner一个HDFS上的资源上传路径
- YR准备资源信息(切片信息,Jar包,Job信息),提交到HDFS
- 资源申请完毕,YR向RM申请运行AP
- RM将AP放到队列中
- NM领取AP,在容器里面开启MRAppMaster
- MPA将HDFS上刚才YR提交的资源拉到本地
- 向RM申请运行MapTask资源(也是放到一个队列里等待RM分配)
- RM根据NM资源情况,通知NM领取MT,创建容器
- MRA向对应容器发布脚本运行程序
- 容器里的MapTask去HDFS取数据读到本地
- MPA在向RM申请容器,运行ReduceTask程序
- RT所在的容器去MT所在的容器将对应的数据COPY到本地容器
- 最后将结果写到HDFS上即可
- MP向RM告知自己注销,释放资源