Spark与flink计算引擎工作原理，2024年最新大数据开发studio基础

最新推荐文章于 2024-06-17 15:07:18 发布

2401_84166878

最新推荐文章于 2024-06-17 15:07:18 发布

阅读量307

点赞数 3

分类专栏： 2024年程序员学习文章标签：大数据 spark flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84166878/article/details/137489744

版权

本文介绍了Spark的Local和standalone模式，重点讲解了Spark ON Yarn的工作原理，包括client和cluster模式的区别。讨论了Driver、ApplicationMaster的角色，并提供了个人在大数据领域的学习和工作经验分享，最后分享了一份全面的大数据学习资料。

摘要由CSDN通过智能技术生成

在这里插入图片描述

Spark搭建模式：
Local本地模式：单机本地使用多线程实现分布式计算,一般测试环境使用
在这里插入图片描述
standalone:

spark ON Yarn 常用（推荐），在实际开发中，大数据任务都有统一的资源管理和任务调度工具进行管理，YARN比较成熟，支持多种调度策略，例如Capcity等，可以使用YARN调度管理MR/Hive/spark/flink
spark ON Yarn本质是spark任务的字class字节码文件打包成jar包，上传到YARN集群的JVM中去运行，Spark On Yarn根据Driver运行在哪里分为2种模式:client模式和cluster模式

client模式：
spark的driver驱动程序，运行在提交任务的客户端上，和集群通信成本比较高
因为driver的在客户端，所以driver中的程序结果输出可以在客户端控制台看到

ApplicationMaster介绍
Hadoop用户向YARN集群提交应用程序时,提交程序中包含ApplicationMaster，用于向资源调度器申请执行任务的资源容器Container，运行用户自己的程序任务job，监控整个任务的执行，跟踪整个任务的状态，处理任务失败等异常情况。ResourceManager&#x

最低0.47元/天解锁文章

关注

3
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
Spark与flink计算引擎工作原理，2024年最新大数据开发studio基础

Driver:Spark中的Driver是运行上述Application的main函数，运行main函数会创建SparkContext，创建SparkContext的目的是为了准备Spark应用程序的运行环境，在Spark中SparkContext负责与ClusterManager通信，进行资源申请、任务的分配和监控等，当Executor部分运行完毕后，Driver同时负责将SparkContext关闭，通常用SparkContext代表Driver。4888 （备注大数据获取）**
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。