Spark资源调度与任务调度

最新推荐文章于 2020-06-19 09:11:07 发布

冯小瑞

最新推荐文章于 2020-06-19 09:11:07 发布

阅读量205

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Romantic_sir/article/details/104819557

版权

当启动完spark-submit之后：

进入资源调度

①首先worker会向Master汇报资源

②Master掌握了集群资源

③创建SparkContext，Driver端启动，生成DAGScheduler和TaskScheduler

④TaskScheduler向Master申请资源

⑤Master收到请求之后，会找到满足资源的worker节点启动Executor

⑥Executor反向注册到Driver，Driver掌握一批计算资源

进入任务调度

⑦有几个action算子就会有几个job，我们已经有job了

⑧DAGScheduler拿到DAG，按照RDD的宽依赖将job切分成一个个的stage，将stage以TaskSet的方式提交给TaskScheduler

⑨TaskScheduler遍历TaskSet，拿到一个个Task，发送到worker节点的Executor中执行

⑩发送task到Executor中

最后：Driver端监控task，并回收结果

粗粒度资源申请：Spark

application在启动之前首先将所有的资源申请完毕，如果申请不到一直处于等待状态，一直到申请到为止。必须一次申请完毕之后才会执行任务，这样task在执行的时候就不用自己申请资源，加快了task效率，task快了，job就快了，job快了，application就快了。必须是最后一个task执行完毕之后，才会释放所有资源。

优点：执行速度快

缺点：容易造成资源不能充分利用

细粒度资源申请：MapReduce

application在启动之前不会将所有task资源申请完，task执行时自己申请资源释放资源，这样task执行相对较慢，但是集群资源可以充分利用。

优点：集群资源可以充分利用

缺点：application执行相对较慢

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark资源调度与任务调度

当启动完spark-submit之后：进入资源调度①首先worker会向Master汇报资源②Master掌握了集群资源③创建SparkContext，Driver端启动，生成DAGScheduler和TaskScheduler④TaskScheduler向Master申请资源⑤Master收到请求之后，会找到满足资源的worker节点启动Executor⑥Ex...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。