Yarn-cluster及Yarn-client两种提交模式剖析

Yarn-cluster提交模式原理图

Yarn-cluster提交模式原理图

Yarn-client提交模式原理图

Yarn-client提交模式原理图

两种提交模式优缺点分析

  1. Yarn-client,用于本地测试,因为Driver运行在本地客户端,负责调度application,会与yarn集群产生超大量的网络通信,从而导致导致网卡流量激增,可能会被你们公司的SA(运维)警告。好处在于,直接执行时,本地可以看到所有的log,方便调试。
  2. Yarn-cluster,用于生产环境,因为Driver运行在NodeManager,没有网卡流量激增的问题。
    缺点在于,调试不方便,本地spark-submit提交后,看不到log,只能通过yarn application-logs application_id这种命令来查看,很麻烦。

切换方式

  1. Spark内核架构,其实就是第一种模式,standalone模式,基于Spark自己的Master-Worker集群。
  2. 第二种,是基于YARN的yarn-cluster模式。
  3. 第三种,是基于YARN的yarn-client模式。
  4. 如果,你要切换到第二种和第三种模式,很简单,首先在/spark/conf/spark-env.sh中添加 export HADOOP_HOME=user/local/hadoop(hadoop的安装目录),然后将我们之前用于提交spark应用程序的spark-submit脚本,加上–master参数,设置为yarn-cluster,或yarn-client,即可。如果你没设置,那么,就是standalone模式。

总结

yarn-client 用的本地Driver
yarn-cluster 用其中一个NodeManager做Driver

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

启四

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值