spark任务提交方式standalone-client和standalone-cluster对比

最新推荐文章于 2024-07-25 10:39:07 发布

伊一cherry大数据

最新推荐文章于 2024-07-25 10:39:07 发布

阅读量370

点赞数 1

文章标签： spark Powered by 金山文档

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_41745141/article/details/129367166

版权

spark中Standalone有两种任务提交模式，分别是Standalone-client模式和Standalone-cluster模式，其区别如下：

一、standalone-client任务提交方式

1、client模式提交任务后，会在客户端启动Driver。

2、Driver与Master通信，为当前的Application申请资源。

3、Master接受到资源申请，Master跟Worker进行RPC通信，让Worker启动Executor。

4、Worker启动Executor。

5、Executor跟Driver进行通信。

6、rdd触发action操作后，会根据最后这个rdd从后往前推断依赖关系，遇到shuffle就好切分stage，会递归切分，递归的出口是某个rdd没有父rdd了，DAGScheduler切分完stage后，先提交前面的stage，执行完后再提交后面的stage，stage会生产task，一个stage会生产很多业务逻辑相同的task，然后将以TaskSet的形式传递给TaskScheduler，然后TaskScheduler将Task序列化，根据资源情况，发送给Executor。

7、Executor接收到Task，先将task反序列化，然后将task用一个实现了Runnable接口的实现类包装起来，然后将该包装类丢入到线程池，然后包装类的run方法就会被执行，进而调用task的计算逻辑。

二、standalone-cluster任务提交方式

1、cluster模式下提交应用程序后，会向Master申请启动Driver。

2、Master接受请求后，向Worker请求启动Driver。

3、Worker 收到请求后启动 Driver。

4、Driver启动后，向Master申请资源。

5、资源申请成功后，Master跟Worker进行RPC通信，让Worker启动Executor

6、Worker启动Executor

7、Executor跟Driver进行通信，Driver将Task发送到Worker执行。

8、Worker将执行情况和执行结果返回给Driver端。

总结：Standalone-client模式Driver进程是在客户端启动的，这里的客户端是指提交任务的那个节点。Driver端可以看到Task执行的情况。

Standalone-cluster模式Driver进程是在集群中某一台Worker上执行的，客户端无法查看Task执行情况。

伊一cherry大数据

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
spark任务提交方式standalone-client和standalone-cluster对比

spark任务提交方式standalone-client和standalone-cluster对比
复制链接

扫一扫

伊一cherry大数据 CSDN认证博客专家 CSDN认证企业博客

码龄6年

25: 原创

29万+: 周排名

5万+: 总排名

1万+: 访问

: 等级

403: 积分

57: 粉丝

111: 获赞

5: 评论

136: 收藏

私信

关注

热门文章

最新评论

如何查看hdfs的fsimage文件
CSDN-Ada助手: 恭喜您写了第20篇博客！标题中提到的“如何查看hdfs的fsimage文件”这个话题非常有价值，对于想要了解和学习hdfs的用户来说一定很有帮助。希望您能继续保持创作的热情，分享更多关于hdfs的知识和技巧。下一步的创作建议是可以深入探讨hdfs的fsimage文件的结构和作用，同时结合实际案例，给出一些使用fsimage文件进行故障恢复或数据回滚的实践指导。期待您的下一篇博客！
Kafka的ACK参数详解及ISR、HW、LEO介绍
IT732568: 讲的很好易懂
FLINK SQL 1.17.1读取KAFKA数据，实时计算后写入MYSQL
CSDN-Ada助手: 恭喜您写了第19篇博客！标题看起来非常吸引人，我对您实时计算后写入MYSQL的方法非常感兴趣。您的博客一直以来都给我带来很多启发和帮助，真的很感谢您的分享。在下一步的创作中，我想建议您能够适当地加入一些实际案例或者应用场景，以便读者更好地理解和运用这些知识。另外，如果可能的话，您可以介绍一些常见的问题和解决方案，这样读者在实践中就能更好地应对挑战。再次恭喜您的持续创作，并期待您未来更多精彩的博客！谢谢您的付出和分享！
Kafka的ACK参数详解及ISR、HW、LEO介绍
汪丽: 通过这篇文章对这方面知识有了更充分的了解
Kafka的ACK参数详解及ISR、HW、LEO介绍
1886i: 博主讲的很详细

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

伊一cherry大数据 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。