spark on yarn 运行流程

一、driver 运行在集群中(yarn-cluster模式)
1、client 向 yarn 提交一个job
2、ResouceManager 为该job在某个 NodeManager 上分配一个 ApplicationMaster,NodeManager启动ApplicationMaster,ApplicationMaster启动 driver(sparkContext)(cluster 模式下,driver 包含在 appMaster 里)
3、ApplicationMaster 启动后完成初始化作业,driver 生成 DAG ,DAG scheduler 将DAG 拆分成 stage (TaskSet)发送给 Task Scheduler
4、ApplicationMaster向 RM 申请资源,ResouceManager 返回 Executor信息
5、ApplicationMaster根据返回的资源信息在,通过 rpc 在对应的nodemanager启动相应的 Executor
6、Excutor 启动后 向 driver 进行注册并申请 task,driver 端的 TaskScheduler 将 task 发送给 Excutor
7、Executor 执行task ,执行结果写入外部或返回 driver 端
这里写图片描述
二、driver运行在client端(yarn-client)
1、启动后直接运行应用程序,启动 driver,并初始化
2、client 向 yarn 提交job
3、RM 为该job 在某个 NM 分配一个 AM
4、AM 向 RM 申请资源,RM 返回Executor 信息
5、AM 通过 RPC 启动相应的 Executor
6、driver 生成DAG 图,DAG scheduler 将DAG 拆分成 stage (TaskSet)发送给 Task Scheduler
7、excutor 向 driver 注册 ,并向 Driver 申请 task,task scheduler 发送 task 给execitor
8、Executor 执行task 并将结果写入第三方存储系统或者 Driver 端
这里写图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值