Spark执行流程（详细）

fanbuer

已于 2023-07-10 10:11:59 修改

阅读量5.1k

点赞数 1

文章标签：大数据 spark

于 2020-08-04 16:44:08 首次发布

本文链接：https://blog.csdn.net/shenyuye/article/details/107789973

版权

大体执行流程

1.driver执行main方法（懒执行），action算子触发触发job

2.根据宽窄依赖划分stage

3.每个stage会被整理成taskset(包含多个task)4.每个task分发到具体的Executor去执行

完整调度流程

1.当Driver启动的时候，初始化时会相应的创建DagScheduler、TaskScheduler

2.TaskScheduler初始化的时候，会创建SchedulerBacked(主要负责集群之间的通讯)

3.SchedulerBacked和ApplicationMaster进行通讯，SchedulerBacked会告诉ApplicationManager会启动多少个Executor

4.然后ApplicationManager会向ResourceManager申请资源

5.然后启动相应的Executor

6.Executor调用ExecutorBackend向Driver里面的ScheduleBackend注册，当所有的Executor都注册完之后

7.Driver 开始执行 main 函数，遇到 Action 算子的时候会触发 Job ，根据宽依赖在DagScheduler中进行Stag

最低0.47元/天解锁文章

关注

1
点赞
踩
36

收藏

觉得还不错? 一键收藏
1
评论
Spark执行流程（详细）

大体执行流程1.driver执行main方法（懒执行），action算子触发触发job2.根据宽窄依赖划分stage3.每个stage会被整理成taskset(包含多个task)4.每个task分发到具体的Executor去执行完整调度流程1.当Driver启动的时候，初始化时会相应的创建DagScheduler、TaskScheduler2.TaskScheduler初始化的时候，会创建SchedulerBacked(主要负责集群之间的通讯)3.Sc...
复制链接

扫一扫

fanbuer CSDN认证博客专家 CSDN认证企业博客

码龄10年

35: 原创

1万+: 周排名

16万+: 总排名

6万+: 访问

: 等级

655: 积分

5290: 粉丝

35: 获赞

18: 评论

162: 收藏

私信

关注

热门文章

最新评论

idea配置ssh远程连接服务器（效率）
并州刺史: 下午我试了下，用的第二种方法发现时可以的，厉害了。
idea配置ssh远程连接服务器（效率）
fanbuer: 一段时间没有数据就会自动断开，可以让本地或者服务器隔一段时间发送一个请求保持通信就行，有以下三种解决方法，按需选择一种就行。第一种：服务器 /etc/ssh/sshd_config 中添加如下的配置： ClientAliveInterval 60 第二种：客户端 ~/.ssh/ 文件夹中添加 config 文件，并添加下面的配置： ServerAliveInterval 60 第三种：只想让当前的 ssh 保持连接，用下面命令： ssh -o ServerAliveInterval=60 userName@serverIP
idea配置ssh远程连接服务器（效率）
并州刺史: 请问怎么解决长时间不操作，terminal死掉的情况？
Spark执行流程（详细）
高性能服务器: 1）构建 Spark Application 的运行环境（启动 SparkContext）， SparkContext 向资源管理器（可以是 Standalone、Mesos 或 YARN）注册并申请运行 Executor 资源； 2）资源管理器分配 Executor 资源并启动 StandaloneExecutorBackend， Executor 运行情况将随着心跳发送到资源管理器上； 3）SparkContext 构建成 DAG 图，将 DAG 图分解成 Stage，并把 Taskset 发送给 Task Scheduler 。 Executor 向 SparkContext 申请 Task，Task Scheduler 将 Task 发放给 Executor 运行同时 SparkContext 将应用程序代码发放给 Executor； 4）Task 在 Executor 上运行，运行完毕释放所有资源。
解决配置完kerberos后，HDFS、YARN的web页面无法访问
qiutian2017: 找到原因了，气味ini文件，其他的配置没删掉。只保留libdefaults realms

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。