spark资源调度源码浅谈

最新推荐文章于 2024-05-02 20:04:33 发布

壮志-凌云

最新推荐文章于 2024-05-02 20:04:33 发布

阅读量497

点赞数

分类专栏： spark 文章标签： spark 源码资源调度实现大数据 scala

本文链接：https://blog.csdn.net/weixin_43607641/article/details/83790562

版权

spark 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

纸上得来终觉浅，觉知还是要撸代码

此文章适合以下人群参考：
1.接触过spark，有spark基础的同学
2.知其然不知其所以然的同学
3.对于源码好奇的同学
4.大神勿看

大家都知道，大数据中，其实最紧张的就是资源，那么如何利用有限的资源提高运算与吞吐，就是一个框架的核心。一直觉得spark是一个不错的大数据框架，那么spark怎么解决资源调度的问题？

下面我们简单梳理一下spark的资源调度流程。首选，集群启动worker向master汇报资源，master掌握集群资源，client提交任务后，master会在worker中创建一个driver,driver向master请求资源，master分配资源在worker中创建excutor，最后driver分发task任务并监听。那么这个过程在代码是如何实现的？我们提交的命令如何解析？集群之间怎么通信？下面是我撸了两天spark资源调度的代码的一些小总结。我看的是1.6版本的源码，有兴趣的同学可以下载下来，一起跟下

在这里插入图片描述
一、寻找程序入口
1。查看执行任务的命令脚本start-all.sh中看到会执行下面两个脚本

2。我可以在start-master.sh脚本中可以看到，master的启动执行类为CLASS=“org.apache.spark.deploy.master.Master”

3。查看start-slaves.sh脚本可以看到，其实本质上还是执行的是start-slave.sh
在这里插入图片描述
4。查看start-slave.sh可以找到org.apache.spark.deploy.worker.Worker 这个包

由上可以知道，spark启动的时候分别执行的是master包中的Master和worker包中的Worker

5.查看提交任务命令。spark-submit.sh,可以找到任务提交的时候，执行的的是/bin/spark-class org.apache.spark.deploy.SparkSubmit中的程序
在这里插入图片描述

二、解析任务提交命令
1.根据spark-submit.sh脚本中可以知道，整个资源调度起源于
package org.apache.spark.deploy 这个类中的SparkSubmit的方法

在这里插入图片描述

2。在这个类中寻找main函数入口
在这里插入图片描述

3、如上图，我们可以看到经过SparkSubmitArguments 后解析出一些kill，submit等命令。查看SparkSubmitArguments 参数解析类对象，找到action
在这里插入图片描述

由234行代码可以看到，判断一下是否有值，如果没有值则提交submit命令任务

4.回到SparkSubmit中的main函数，找到submit方法，点进来

在这里插入图片描述
5.如上方法反悔了一个四元组，参数，环境变量，系统配置，主类。点入次方法

如上图所示，该方法中设置了集群的部署模式，集群管理，纠错。这个方法中设置大量的提交参数的判断与设置，例如R语言与mesos资源管理的配合不支持、py的设置，有兴趣的自己研究下。
我们以standalone cluster模式来跟踪代码
在这里插入图片描述
我们看到，通过standalone cluster集群模式启动，启动的是org.apache.spark.deploy.Client这个客户端。