Spark资源调度机制流程

最新推荐文章于 2023-07-17 16:29:19 发布

Alexkay

最新推荐文章于 2023-07-17 16:29:19 发布

阅读量703

点赞数

分类专栏： Spark

本文链接：https://blog.csdn.net/NASAXK/article/details/50936617

版权

Spark 专栏收录该内容

10 篇文章 0 订阅

订阅专栏

1、SparkContext实例化，调用createTaskScheduler来创建TaskSchedulerImpl和SparkDeploySchedulerBackend；

2、在SparkContext实例化的时候，调用TaskSchedulerImpl的start，在该start方法中调用SparkDeploySchedulerBackend的start方法；

3、在SparkDeploySchedulerBackend的start方法中创建AppClient对象并调用AppClient对象的start方法，在该start方法中会创建ClientEndpoint；

4、在创建的ClientEndpoint中传入Command来指定具体为当前应用程序启动的Executor进程的入口类的名称CoarseGrainedExecutorBackend；

5、ClientEndpoint启动并通过tryRegisterAllMaster来向Master注册当前应用程序；

6、Master接收到注册信息，判断是否可以运行该App。如果可以运行，则会为该程序生成Job ID，通过 schedule来分配计算资源（具体计算资源的分配是通过应用程序的运行方式，Memory、cores等配置信息来决定的），然后Master发送指令给Worker，

7、Worker中为当前应用程序分配计算资源时会首先分配 ExecutorRunner；

8、ExecutorRunner内部通过Thread的方式构建ProcessBuilder来启动一个JVM进程，这个JVM进程启动时加载的main方法所在的类的名称（就是在创建ClientEndpoint时传入的Command来指定具体名称为CoarseGrainedExecutorBackend的类）；

9、JVM在通过ProcessBuilder启动的时候获得了CoarseGrainedExecutorBackend后，加载并调用其中的main方法。在main方法中会实例化CoarseGrainedExecutorBackend本身这个消息循环体；

10、CoarseGrainedExecutorBackend通过回调onStart向DriverEndpoint发送RegisterExecutor来注册当前的CoarseGrainedExecutorBackend；

11、DriverEndpoint收到注册信息（RegisterExecutor）并保持在了SparkDeploySchedulerBackend实例的内存数据结构中，由此，Driver获得了计算资源。到此，资源调试结束

Alexkay

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark资源调度机制流程

1、SparkContext实例化，调用createTaskScheduler来创建TaskSchedulerImpl和SparkDeploySchedulerBackend；2、在SparkContext实例化的时候，调用TaskSchedulerImpl的start，在该start方法中调用SparkDeploySchedulerBackend的start方法；3、在SparkDepl
复制链接

扫一扫

专栏目录