spark on yarn【在yarn上提交spark 程序配置及实现方式】

本文详细介绍了如何在YARN上启动Spark程序,包括cluster和client两种部署模式,以及配置YARN模式参数、添加JAR、运行参数设置等关键步骤。同时,文章提到了在不同模式下驱动程序和执行程序的本地目录使用情况,以及注意事项,旨在帮助开发者更好地理解和执行Spark on YARN的应用。
摘要由CSDN通过智能技术生成

最近老是忘记东西,,,在这里简单记录一下


1、在yarn上启动spark程序

修改 spark-env.sh文件,配置hadoop的配置文件,或者yarn的配置文件即可(两者选择其中一种即可)

指向包含Hadoop集群的(客户端)配置文件的目录。这些配置用于写入HDFS并连接到YARN ResourceManager。此目录中包含的配置将分发到YARN群集,以便应用程序使用的所有容器使用相同的配置。如果配置引用了非YARN管理的Java系统属性或环境变量,则还应在Spark应用程序的配置中设置它们(驱动程序,执行程序和在客户端模式下运行时的AM)。

export HADOOP_CONF_DIR=/use/local/hadoop/etc/hadoop/
#或者
export YARN_CONF_DIR=/use/local/hadoop/etc/hadoop/

2、两种部署模式

2.1、cluster模式

Spark驱动程序在应用程序主进程内运行,该进程由群集上的YARN管理,客户端可以在启动应用程序后消失。

2.2、client模式

驱动程序在客户端进程中运行,应用程序主服务器仅用于从YARN请求资源。

2.3、yarn 模式参数

在YARN模式下,资源管理器的地址从Hadoop配置中获取。因此,--master参数是yarn。如以下代码所示:

./bin/spark-submit --class path.to.your.Class --master yarn 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值