Spark的Yarn CLuster与Yarn Client区别

本文对比了Spark在Yarn Cluster和Yarn Client模式下的运行差异。Cluster模式下,Driver运行在Application Master(AM)中,适合长时间运行的任务,不适用于交互式作业。而Client模式中,AM仅负责申请Executor资源,Driver在客户端运行,适合交互式应用。当在Client模式下调试通过的Spark SQL程序在Cluster模式下运行报错,可能是因为从节点缺少数据库访问权限,需赋予相应权限。
摘要由CSDN通过智能技术生成

一、Yarn Cluster模式

二、Yarn Client模式

        对比两种模式的架构图,可以看出,两者的本质区别:AM进程的区别。

        Cluster模式下,driver运行在AM中,负责向Yarn(RM)申请资源,并监督Application的运行情况,当Client(这里的Client指的是Master节点)提交作业后,就会关掉Client,作业会继续在yarn上运行,这也是Cluster模式不适合交互类型作业的原因。而Client模式,AM仅向Yarn(RM)申请executor资源,之后Client会和请求的Container通信来进行任务的调度,即Client不能被关闭

        在工作当中,常常采用的工作方式是,先在Client模式下调通项目,然后再将项目提交到Cluster下运行。所以,跑一些SparkSQL程序的时候,经常会遇到类似的问题:为什么Client可以跑通程序,而放到Cluster上,就报错呢?

       

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值