Spark内核架构剖析

最新推荐文章于 2021-12-12 18:05:06 发布

LNP一号

最新推荐文章于 2021-12-12 18:05:06 发布

阅读量246

点赞数

分类专栏： # Spark 文章标签：大数据 Spark Spark架构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ln1593570p/article/details/82843977

版权

Spark 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1(图中流程标号)：当我们在strandalone模式下提交我们的spark应用时，会创建和构造一个DriverActor进程出来，这个进程会执行我们的Application应用程序。。。

2：写过spark应用程序的都知道，第一步需要构造SparkConf然后创建一个SC(SparkContext)，重点来了，SparkContext在初始化的时候最重要的是干两件事：就是构造DAGScheduler和TaskScheDuler。

3：然后，TaskScheduler会负责，通过他的一个后台进程，去连接Master,向Master注册Application.

4：Master接收到TaskScheduler的注册请求后，会使用自己的资源调度算法，在Spark集群的Worker上为Application申请多个Executor，并且通知Worker启动相应的Executor。（实际中有许多的Worker和Executor，这里只用一个来画图展示）

5：Worker会为Application启动相应的Executor。

6：Executor启动后会把自己反向注册到Taskscheduler上面去，至此SparkContext的初始化结束，Driver继续执行我们的程序。

7：每当执行到一个action操作(例如：foreach...)的时候，就会创建一个job，并将job提交给DAGSheduler，DAGScheduler会将job划分为多个stage（按照宽依赖进行划分），然后每个stage创建一个TaskSet，并将TaskSet交给TaskSheduler。

8：TaskSheduler会将每一个TaskSet中的每一个task提交到executor上执行（task分配算法）。

9：Executor每接收到一个task,就会用TaskRunner来封装task,然后丢入线程池进行执行。

总结：spark应用程序的执行，就是stage分批次的作为task提交到executor执行，每一个task针对RDD的partition,执行我们的算子和函数，以此类推，直到所有的操作执行完为止。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

LNP一号 CSDN认证博客专家 CSDN认证企业博客

码龄7年

30: 原创

7万+: 周排名

63万+: 总排名

18万+: 访问

: 等级

1220: 积分

27: 粉丝

45: 获赞

54: 评论

255: 收藏

私信

关注

热门文章

分类专栏

最新评论

Python装饰器-服务层级事务控制
LNP一号: 可以理解为向前端响应的自定义封装对象类以及方法
Python装饰器-服务层级事务控制
眉目-: 您好，ResultInfo指的是什么呀
如何更改pipenv install 的虚拟环境文件夹路径
wcg1987: 你的方法不行，人家的可以
如何更改pipenv install 的虚拟环境文件夹路径
Joah YI: 明白人
spring boot 2.x静态资源会被拦截器拦截的原因和解决方法
王先生草: springboot 2.0.6 , spring5.0.10源码和你截的图是一样的 , 但是为啥我的就没有拦截啊 AuthorityConfig : addInspectionInterceptor=>>增加验权拦截配置:/** AuthorityConfig : addInspectionInterceptor==>>增加验权非拦截配置:{} pingHandlerMapping : Mapped "{[/test],methods=[GET]}" onto public org.springframewor pingHandlerMapping : Mapped "{[/yds/getDo],methods=[POST],produces=[application/json pingHandlerMapping : Mapped "{[/ad/getInfo],methods=[GET]}" onto com.wenb.test1.pojo pingHandlerMapping : Mapped "{[/ad/getRegulation],methods=[GET]}" onto com.wenb.test pingHandlerMapping : Mapped "{[/common/getCount],methods=[GET]}" onto com.wenb.test1 pingHandlerMapping : Mapped "{[/common/getH5Info],methods=[GET]}" onto com.wenb.test pingHandlerMapping : Mapped "{[/error]}" onto public org.springframework.http.Respon pingHandlerMapping : Mapped "{[/error],produces=[text/html]}" onto public org.spring UrlHandlerMapping : Mapped URL path [/webjars/**] onto handler of type [class org.s UrlHandlerMapping : Mapped URL path [/**] onto handl

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。