spark学习笔记之三：调度流程剖析

最新推荐文章于 2024-04-14 20:12:48 发布

书灯

最新推荐文章于 2024-04-14 20:12:48 发布

阅读量280

点赞数

文章标签： spark 调度流程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/struct_slllp_main/article/details/76210206

版权

程序员->IDEA编写代码->jar包->放到集群计算->

提交spark应用程序的机器->shell中spark-submit脚本提交程序->运行Driver进程（client模式和提交机器相同）->new sparkContext对象->sparkContext在初始化的时候，会启动UI，设置spark的env，做的最重要的事情就是构造出一个TaskScheduler和一个DAGScheduler->

TaskScheduler->负责它对应的一个后台进程，去连接Master，向Master注册这个Application->Master接收到Application注册过来的请求之后，会用资源调度的算法，在spark集群的Worker上为这个App启动多个Executor进程->Executor启动之后会反向注册到TaskScheduler上面来->所有Executor都反向注册到Driver上之后，Driver结束SparkContext初始化，会继续执行我们自己编写的代码。
DAGScheduler -> Job的切分（action）->stage的切分（宽依赖）->生成包含多个task（pipeline）的taskSet->TaskScheduler将taskSet打散->TaskScheduler会（通过分配算法）把Taskset里面的每一个Task提交到Executor上去执行->Executor的线程去运行包含Task的TaskRunner

->总结，最后整个这个Spark应用程序的执行就是Stage分批次的做为Taskset提交到Executor里面执行，每个Task针对RDD的一个partition，执行我们的算子和函数，task并行执行。

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
spark学习笔记之三：调度流程剖析

调度流程剖析
复制链接

扫一扫

书灯 CSDN认证博客专家 CSDN认证企业博客

码龄8年

102: 原创

6万+: 周排名

197万+: 总排名

12万+: 访问

: 等级

2141: 积分

23: 粉丝

36: 获赞

21: 评论

290: 收藏

私信

关注

热门文章

分类专栏

C/C++ 30篇
linux 6篇
网络编程 7篇
python 10篇
Qt 11篇
数据库 6篇
hadoop 1篇
spark 30篇
IoT 2篇

最新评论

Qt开源库之----qrencode
白翚: 为什么我下载的版本没找不到config.h.in文件呢，大佬
Docker中运行Qt应用程序
xuyide_1102: 这个是windows的 docker desktop 么。或者是有界面的linux？
Docker中运行Qt应用程序
hack0072005: 大佬，请问 https://blog.csdn.net/qq_27350133/article/details/83445258 这个链接失效了，还有其他的地址吗？
Docker中运行Qt应用程序
grant-bobo: 我现在遇到弹框变成黑的问题，请问该如何解决？
Qt 安装包下载
微光呀: 谢谢大哥，好人呀

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

书灯 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。