spark submit——yarn模式参数调优

spark官网上的参数默认值设置:https://spark.apache.org/docs/latest/configuration.html#spark-streaming

此处记录一下最近整理的spark 集群模式提交yarn的部分常用参数设置 (友情提示:以下代码块中注释部分未加注释标# )

spark-submit --master yarn-cluster \                   yarn模式
        --name ${APP_NAME} \                              appName
        --executor-memory 3G \                              每个executor分配的内存 此处可参考上篇 executor内存分配图解
        --executor-cores 3 \                 每个executor分配的核数   核数*executor数 = task被执行的并发度=输入分片数=输入rdd分区数 但应限制在queue总分配核数以内                   
        --num-executors 12  \             集群中启动的executor总数
        --driver-memory 2G \                driver运行内存 默认值为1G
        --driver-cores  1 \                driver核数 可以不用改

        --conf spark.yarn.executor.memoryOverhead=2048 \          executor堆外内存,值为 executorMemory * 0.1, 最小384    spark shuffle的底层传输方式是使用netty传输 netty在进行网络传输的过程中会申请堆外内存 


        --conf spark.yarn.driver.memoryOverhead=
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值