yarn 下cluster和client异同点-源码级别

本文详细探讨了Spark在YARN模式下client和cluster部署模式的区别,包括driver运行位置、提交流程和源码解析。在client模式中,driver在本地启动并与ResourceManager通信,而在cluster模式中,driver在集群内部启动。此外,文章还介绍了Spark的master、slave、driver和executor的角色及职责。
摘要由CSDN通过智能技术生成

Spark-submit

部署模式

      本地模式local[*]、standalone 模式、yarn模式;对于standalone模式和yarn模式分为:client(客户端)和cluster(集群) 提交方式

Client模式和cluster模式区别

       主要的区别是driver运行的节点;使用deploy-mode client/cluster来指定运行的模式  

client模式(yarn)

     1:在本地机器提交jar,即spark-submit命令,然后在本地开启一个driver,把jar包提交到master;让master来控制执行应用

      2:流程:spark-submit命令在本地机器开启driver,driver把jar相关的流程交给master进行调度,master在worker节点开启executor运行相关的任务,相对应的executor也需要向driver反向注册,汇报相关进度;executor最终会把结果发送到driver(客户端可以看到结果)

cluster模式(yarn)

     1:在本地提交任务,即spark-submit命令,但是此时客户端不会创建driver,会把任务发送给master,master把请求封装成一个applicationMaster即driver会在worker相关的节点开启一个容器去创建applicationMaster即在集群中的某一个节点中创建driver

    2:流程:本地机器提交任务,把请求发送给master,master会把请求转换为一个ApplicationMaster即driver,会在集群的某个节点中开启driver,然后master根据driver的请求,在相关的worker开启executor中运行任务,然后这些executor也需要向driver汇报

      3:此时的driver不是本地机器了

      4:查看结果,知道:端口号已经改变了,机器也已经改变

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

best啊李

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值