spark性能优化

1、分配更多的资源

1.1、分配哪些资源

executor-memory、executor-cores、num-executor

1.2、在哪里设置这些资源

在生成环境中,提交spark任务时,使用spark-submit shell脚本,可以调整对应的参数
提交任务的脚本

spark-submit \
--master saprk://node01:7077 \
--class cn.tuyou.Wordcount \
--num-executor 3 \      //配置executor的数量
--driver-memory 5g \	//配置driver的内存(无太大影响)
--executor-memory 1g \  //配置每一个executor的内存大小
--executor-cores 3 \    //配置每一个executor的cpu个数
1.3、设置这些资源为什么能优化

提高executor-memory,能提高executor的内存大小,本质提高的读取文件的速度
提高executor-cores,能提高每个executor的cpu个数,本质增强的处理task的并行执行能力
提高num-executor,即提高集群部署的主机数量,这个是最有效的优化(有钱就是任性)

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值