Spark on YARN模式下的资源分配配置
前言
Spark on YARN模式下的主要资源为CPU和内存。
Spark资源分配配置在spark-defaults.conf中设置,其属性配置一般以 ***spark***开头,类似于spark.xx.xx。
Spark on Yarn中的两种部署模式
一般来说,YARN上启动Spark应用程序主要有两种模式:client模式和cluster模式
- 在yarn-client模式下,驱动程序在客户端进程中运行,而Application Master 仅用于从YARN请求资源。
- 在yarn-cluster模式下,Spark驱动程序Application Master 内运行,该进程由群集上的YARN管理,客户端可以在启动应用程序后退出。
关于Application Master (AM)的配置
yarn-client
属性名 | 默认值 | 描述 |
---|---|---|
spark.yarn.am.memory | 512m | 在Client模式下用于YARN Application Master的内存量,格式与JVM内存字符串相同(例如512m,2g)。 在Cluster模式下,请改用spark.driv |