spark参数调优系列 目录地址:
https://blog.csdn.net/zyzzxycj/article/details/81011540
⑦ Executor behavior
spark.broadcast.blockSize
TorrentBroadcastFactory中的每一个block大小,默认4m
过大会减少广播时的并行度,过小会导致
BlockManager
产生 performance hit.(暂时没懂这是干啥用的)
spark.executor.cores
每个executor的核数,默认yarn下1核,standalone下为所有可用的核。
spark.default.parallelism
默认RDD的分区数、并行数。
像reduceByKey和join等这种需要分布式shuffle的操作中,最大父RDD的分区数;像
parallelize之类没有父RDD的操作,则取决于运行环境下得cluster manager:如果为单机模式,本机核数;集群模式为所有executor总核数与2中最大的一个。
spark.executor.heartbeatInterval
executor和driver心跳发送间隔,默认10s,必须远远小