首先明确下Yarn到底是什么? Yarn是一个资源调度系统,主要负责任务的维持及为任务分配需要的运行资源.
1.客户端生成相应的文件后,连接resourceManager请求提交一个application
2.resourceManager(RM)给客户端返回一个地址,供客户端提交文件.
3.Client提交文件到指定的HDFS地址上
4.Client向RM申请运行该任务的MRAppMaster.
5.MR将Client的请求的任务初始化为一个task放入到其维护的队列中.
6.当MR的调度策略调度到该task时,向一个NodeManager分配该task