PySpark和Spark的交互流程

最新推荐文章于 2024-07-11 15:23:01 发布

Taker256

最新推荐文章于 2024-07-11 15:23:01 发布

阅读量159

点赞数

文章标签： spark 大数据分布式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Taker256/article/details/134498165

版权

交互方式总共有4种,

1.Client方式提交到Spark集群

2.Cluster方式提交到Spark集群

3.Client方式提交到,SparkOnYarn

4.Cluster方式提交到,SparkOnYarn

第1种.Client方式提交到Spark集群.流程如下:

1.spark-submit提交Spark计算任务。因为是Client部署方式，在哪里提交，Driver就运行在哪里

2.Driver进程加载PySpark程序,通过Py4J,将Python的Spark环境对象,转成Java的Spark环境对象

3.Driver进程向Master主节点申请,执行该Spark计算任务所需的资源

4.Master节点接收到资源请求后,会去Worker节点上创建对应的Executor进程(负责执行具体任务),并告知Driver

5.Driver会和Worker进行连接,并占用相关资源,告知其启动Executor进程,Executor启动会向Driver反向注册(即:建立心跳)

6.Driver通知Executor执行具体的任务

7.Driver通过sc.stop()告知Master释放资源,至此,程序结束

其他3种部署模式跟第1种大概类似,区别分别是:

2.Cluster方式提交到Spark集群

区别是:Driver进程的运行位置发生变化,不再和spark-submit在一起

而是在spark集群上,选择1个Worker进行执行,其他不变

3.Client方式提交到,SparkOnYarn

区别在于:Driver进程把资源调度的工作交给AppMaster进程来实现,Driver主要负责:任务接收,任务管理

4.Cluster方式提交到,SparkOnYarn

区别是:Driver进程和AppMaster进程合为一体,Driver就是AppMaster,AppMaster就是Driver

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
PySpark和Spark的交互流程

Client方式提交到Spark集群Cluster方式提交到Spark集群Client方式提交到,SparkOnYarnCluster方式提交到,SparkOnYarn
复制链接

扫一扫

Taker256 CSDN认证博客专家 CSDN认证企业博客

码龄1年

7: 原创

155万+: 周排名

25万+: 总排名

1407: 访问

: 等级

70: 积分

1: 粉丝

0: 获赞

6: 评论

1: 收藏

私信

关注

热门文章

最新评论

Sql调优+Hive调优+Spark调优
CSDN-Ada助手: 恭喜作者撰写了第6篇博客！标题中提到了Sql调优、Hive调优和Spark调优，这些都是非常重要的话题。我很欣赏您对于这些技术的深入研究和分享精神。在下一步的创作中，我建议您可以考虑深入探讨每个调优技术的具体实践案例和应用场景。通过分享您在实际项目中遇到的挑战和解决方案，可以为读者提供更实用的知识和经验。同时，您也可以尝试探索一些新的调优技术或者与其他领域的技术进行结合，这样能够给读者带来更多的启发和思考。希望您能够继续保持谦虚的态度，不断学习和进步。期待您的下一篇博客！
Spark的5种join策略详解
CSDN-Ada助手: 非常祝贺您写了这篇标题为“Spark的5种join策略详解”的博客！您的努力和持续创作令人钦佩。通过详细解释Spark的5种join策略，您提供了宝贵的信息和指导，让读者更好地了解和应用Spark的join操作。如果我可以提供下一步的创作建议，我认为您可以考虑探索一下每个join策略的适用场景和性能比较。这样的深入分析将使读者更加全面地理解每种join策略的优势和劣势，并能够根据具体情况做出更明智的选择。此外，您还可以考虑分享一些实际案例或经验，以帮助读者更好地应用这些join策略到实际项目中。再次恭喜您，期待您未来更多精彩的博客作品！请继续保持谦虚和积极的态度，您的努力将继续为读者带来更多价值。
SparkMllib-KMeans算法和决策树算法
CSDN-Ada助手: 非常恭喜您写作的第5篇博客！标题“SparkMllib-KMeans算法和决策树算法”让我感到非常有兴趣。您的坚持和创作热情值得赞赏。通过分享关于SparkMllib-KMeans算法和决策树算法的知识，您为读者提供了有价值的信息。在下一步的创作中，我建议您可以继续探索这两种算法的实际应用场景，并分享更多的案例和实践经验。除此之外，您可以考虑与其他机器学习算法进行对比，分析它们的优缺点以及适用场景，这将为读者提供更全面的视角。再次恭喜您的持续创作，并期待您未来更多精彩的博客！谢谢您的分享！
Hive调优
CSDN-Ada助手: 非常高兴看到您在博客中分享了关于“Hive调优”的内容！恭喜您不断地创作和分享知识。您的文章肯定对很多读者都有很大的帮助。在下一步的创作中，或许您可以考虑分享一些实际案例或者挑战，以及在Hive调优过程中的一些实用技巧。这样的内容将进一步丰富读者的知识储备，并帮助他们更好地理解和应用Hive调优的方法。期待在不久的将来能够阅读到更多您的优质博文！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
PySpark和Spark的交互流程
CSDN-Ada助手: 恭喜您写了第四篇博客！标题《PySpark和Spark的交互流程》非常吸引人，我很期待阅读您的观点和经验。对于初学者来说，深入了解PySpark和Spark的交互流程非常有帮助。如果可能的话，下一步您可以探索更多实际案例和使用技巧，这样读者可以更好地理解如何应用这些概念。再次恭喜您，并期待您未来的创作！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。