SparkContext初始化机制

本文深入探讨了SparkContext的初始化过程,包括TaskSchedule的创建、DAGScheduler的初始化、SparkUI的启动以及源码解析。在TaskSchedule初始化时,SparkDeploySchedulerBackend在Master上注册Application、Driver和Worker。DAGScheduler基于DAGSchedulerEventProcessActor进行通信,SparkUI则在4040端口展示应用状态。重点问题包括Application的注册时机和DAGScheduler的调度机制。
摘要由CSDN通过智能技术生成

目录

 

零:初始触发

一:TaskSchedule初始化(宏观)

二:DAGScheduler初始化(宏观)

三:SparkUI

四:源码解析

五:重点问题


零:初始触发

位置:org.apache.spark.SparkContext.scala
初始化代码:
val conf = new SparkConf().setAppName("WordCount");
val sc = new SparkContext(conf)

一:TaskSchedule初始化(宏观)

1.createTaskScheduler() ——》 TaskSchedulerImpl

2.TaskSchedulerImpl.start——》SparkDeploySchedulerBacked.start

3.AppClient——》ClientActor

4.registerWithMaster()
   tryRegisterAllMasters()
   RegisterApplication(case class)
在Master 上注册 Application
在Master 上注册 Driver
在Master 上注册 Worker
Worker上的Executor 反向注册到 TaskSchedule 中

重点:TaskSchedulerImpl底层实际主要基于    SparkDeploySchedulerBackend    来工作

 

二࿱

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值