Spark常用参数解释

Spark的默认配置文件位于堡垒机上的这个位置: $SPARK_CONF_DIR/spark-defaults.conf,用户可以自行查看和理解。

需要注意的是,默认值优先级最低,用户如果提交任务时或者代码里明确指定配置,则以用户配置为先。 用户再理解参数含义的基础上,可根据具体任务情况调整参数(修改提交参数--conf值,不是spark-defaults.conf文件)。

以下常用参数配置均可以通过  --conf XXX=Y 方式使用,其他参数以及介绍请参考 Configuration - Spark 3.2.1 Documentation

参数名称

建议值

解释

spark.masteryarn使用哪种资源调度器,一般使用yarn。本地调试可以用local
spark.submit.deployModeclusterdriver程序运行位置,调试可以用client,线上任务建议cluster。
spark.driver.cores4driver最大使用cpu(线程)数
spark.driver.memory4-10gdriver申请内存大小
spark.executor.memory3. Spark任务调优技巧单个executor申请堆内内存大小
spark.python.worker.memoryspark.executor.memory/2一般使用默认值即可
spark.yarn.executor.memoryOverhead3072单个executor申请堆外内存大小,一般使用默认值即可
spark.executor.cores3. Spark任务调优技巧单个 executor最大并发task数
spark.executor.instances3. Spark任务调优技巧executor数
spark.speculation默认值false推测执行机制默认为false(关闭),如果遇到作业偶尔卡住可以尝试开启。
spark.default.parallelism3. Spark任务调优技巧控制默认RDD的partithion数,读取hdfs文件时partition数以blocksize和是否合并输入为准。
spark.sql.shuffle.partitions

3. Spark任务调优技巧

执行sql或sql类算子时shuffle分区数,数据量大时应提高此值。
spark.pyspark.pythonpython2/python3/python3.5指定pyspark使用的python版本(如果使用docker镜像,请先确认镜像里是否有对应版本,平台基础镜像只有python2)
spark.log.level默认值infoALL, TRACE, DEBUG, INFO, WARN, ERROR, FATAL, OFF,不区分大小写。
spark.sql.hive.mergeFiles默认值false

开启会自动合spark-sql产生的并小文件

spark.hadoop.jd.bdp.streaming.monitor.enable默认值false

是否开启streaming作业batch积压告警功能,默认为false,可通过

--conf spark.hadoop.jd.bdp.streaming.monitor.enable=true 开启

spark.hadoop.jd.bdp.batch.threshold默认值10

streaming作业batch积压告警阈值,默认值为10,用户可根据需求调整,例如:

--conf spark.hadoop.jd.bdp.batch.threshold=20

spark.hadoop.jd.bdp.user.define.erps默认使用平台配置的告警组

对于类似streaming作业batch积压等仅需用户关注的指标,用户可自定义告警组,例如:

--conf spark.hadoop.jd.bdp.user.define.erps="baibing12|maruilei"

(注意:可配置多人,相邻erp用竖线|分隔)

spark.isLoadHivercFile

spark.sql.tempudf.ignoreIfExists

默认false是否加载所有hive udf(只支持spark-sql下使用,不支持spark-submit、pyspark)。(HiveTask里面已经打开,用户无需多余设置)
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值