Spark on Yarn的常见错误

本文介绍了在将Spark作业提交到Yarn上执行时可能遇到的问题。在使用`--master yarn`时,如果不指定`--deploy-mode cluster`,Spark会默认以client模式运行,这可能导致错误。为在Yarn上以cluster模式运行,需要明确添加`--deploy-mode cluster`选项,并确保环境变量`HADOOP_CONF_DIR`或`YARN_CONF_DIR`已正确设置。
摘要由CSDN通过智能技术生成

1. 将spark作业提交到yarn上执行
spark仅仅作为一个客户端

./spark-submit \
--class org.apache.spark.examples.SparkPi \
--master yarn \
 /home/hadoop/app/spark-2.4.4-bin-2.6.0-cdh5.15.1/examples/jars/spark-examples_2.11-2.3.1.jar \
3

--master yarn 相当于 --deploy-mode client,也就是yarn-client模式时,默认--deploy-mode client
如果是yarn-cluster模式,则需要写上--deploy-mode cluster

直接按上方代码启动,会报错:

Exception in thread "main" java.lang.Exception: When running with master 'yarn' either HADOOP_CONF_DIR or YARN_CONF_DIR must be set in the environment.
        at org.apache.spark.deploy.SparkSubmitArguments.validateSubmitArguments(SparkSubmitArguments.scala:288)
        at org.apache.spark.deploy.SparkSubmitArguments.validateArguments(SparkSubmitArguments.scala:248)
        at org.apache.spark.deploy.SparkSubmitArguments.<init>(SparkSubmitArguments.scala:120)
        at org.apache.spark.d
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值