Spark -- 资源申请和任务调度

1、Spark等计算任务一般分成两个步骤:资源申请、任务调度

2、资源申请:
        1、Yarn  Client模式

        1、在 YARN Client 模式下,spark-submit提交 Spark Job之后,就会提交的本地机器上启动Driver端     

        2、 Driver 启动后会与 ResourceManager (RM)建立通讯并发起启动 ApplicationMaster(AM)

        3、请求 RM接收到这个 Job 时,会在集群中选一个合适的 NodeManager (NM)并分配一个 Container(具有计算资源的一个容器),然后启动 ApplicationMaster(初始化SparkContext)

        4、AM的功能相当于一个 ExecutorLaucher (Executor启动器),负责向 RM申请 Container 资源 ,RM收到请求后便会与 NM通信,启动 Container

        5、AM对RM指定 NM分配的 Container 发出启动 Executor 进程请求

        6、Executor进程启动后会向 Driver 反向注册,Executor 全部注册完成后 Driver 开始执行 Job 任务

        7、Driver 中的 SparkContext 分配 Task 给 Executor 执行࿰

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值