Spark yarn模式下的资源分配配置

本文介绍了Spark在YARN模式下的资源分配配置,包括Spark默认配置文件spark-defaults.conf中的属性设置。重点讨论了YARN的client和cluster两种部署模式,以及Application Master(AM)在不同模式下的运行差异。此外,还提到了执行器容器的资源配置,如executor的内存和CPU核心数,并强调了动态资源分配的启用与管理。
摘要由CSDN通过智能技术生成

前言

Spark on YARN模式下的主要资源为CPU内存
Spark资源分配配置在spark-defaults.conf中设置,其属性配置一般以 ***spark***开头,类似于spark.xx.xx。

Spark on Yarn中的两种部署模式

一般来说,YARN上启动Spark应用程序主要有两种模式:client模式和cluster模式

  • 在yarn-client模式下,驱动程序在客户端进程中运行,而Application Master 仅用于从YARN请求资源。
  • 在yarn-cluster模式下,Spark驱动程序Application Master 内运行,该进程由群集上的YARN管理,客户端可以在启动应用程序后退出。

关于Application Master (AM)的配置

yarn-client

属性名 默认值 描述
spark.yarn.am.memory 512m 在Client模式下用于YARN Application Master的内存量,格式与JVM内存字符串相同(例如512m,2g)。
在Cluster模式下,请改用spark.driv
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值