troubleshooting之解决yarn-client模式导致的网卡流量激增问题

本文探讨了Spark在YARN-client模式下因Driver与Executor频繁通信导致的网卡流量激增问题。内容包括Driver和ApplicationMaster的角色,问题产生的原因,以及解决方法。建议测试环境下使用YARN-client模式,而生产环境应采用YARN-cluster模式以避免对本地机器网络造成过大负担。
摘要由CSDN通过智能技术生成

在这里插入图片描述

Driver到底是什么?

我们写的spark程序,打成jar包,用spark-submit来提交。jar包中的一个main类,通过jvm的命令启动起来。

JVM进程,这个进程,其实就是咱们的Driver进程。

Driver进程启动起来以后,执行我们自己写的main函数,从new SparkContext()。。。

ApplicationMaster?

yarn中的核心概念,任何要在yarn上启动的作业类型(mr、spark),都必须有一个。
每种计算框架(mr、spark),如果想要在yarn上执行自己的计算应用,那么就必须自己实现和提供一个ApplicationMaster,相当于是实现了yarn提供的接口,spark自己开发的一个类
spark在yarn-client模式下,application的注册(executor的申请)和计算task的调度,是分离开来的。
standalone模式下,这两个操作都是driver负责的。
ApplicationMaster(ExecutorLauncher)负责executor的申请;driver负责job和stage的划分,以及task的创建、分配和调度

最后,driver接收到属于自己的executor进程的注册之后,就可以去进行我们写的spark作

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值