Spark Standalone 内部原理（一）

最新推荐文章于 2024-06-18 09:25:35 发布

zhuhailong

最新推荐文章于 2024-06-18 09:25:35 发布

阅读量1.3k

点赞数

分类专栏： Spark 文章标签： spark Standalone 内部原理

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011317245/article/details/52431454

版权

本文详细介绍了Spark Standalone模式下，从Application提交到Executor运行的完整过程，包括Master节点的角色、恢复机制，以及Worker、Driver、Application的注册和调度策略。深入理解Spark Standalone的内部工作原理。

摘要由CSDN通过智能技术生成

Standalone内部实现原理：

Spark Application运行的主要流程如下（以Spark-submit模式提交，Driver在本地）

（1）客户端启动，初始化相关的环境变量，包括Application代码的提交。

（2）反射调用org.apache.spark.deploy.yarn.Client，创建DriverActor（其他方式提交，Driver可能运行在Worker节点中）。

（3）向Master注册Driver

（4）Driver初始化SparkContext，DAGScheduler，TaskScheduler等

（5）DAGScheduler向Master注册Application，Master接受请求后，根据资源情况向Worker发送指令启动Executor，Executor启动后向Driver注册。

（6）DAGScheduler进行Job的Stage划分

（7）DAGScheduler提交作业给TaskScheduler

（8）TaskScheduler向注册来的Executor发送LaunchTask命令进行任务的运行

（9）Executor端运行Task相关信息的反序列化，相关Jar包和配置文件的下载，并运行

（10）如果运行的ShuffleMapTask，将结果保存在本地文件中，

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。