大数据技术之 Spark 优化

本文主要探讨Spark性能调优的第一步——最优资源配置。通过调整--num-executors、--driver-memory、--executor-memory和--executor-cores等参数,可以有效地提升Spark任务的执行效率。在适当范围内增加资源分配能直接改善性能,而过多的资源可能会导致浪费。
摘要由CSDN通过智能技术生成

1 Spark 性能调优

1.1 常规性能调优

1.1.1 常规性能调优一:最优资源配置

        Spark 性能调优的第一步,就是为任务分配更多的资源,在一定范围内,增加资源的分配与性能的提升是成正比的,实现了最优的资源配置后,在此基础上再考虑进行后面论述的性能调优策略。
        资源的分配在使用脚本提交 Spark 任务时进行指定,标准的 Spark 任务提交脚本如下所示:
bin/spark-submit \
--class com.atguigu.spark.Analysis \
--master yarn
--deploy-mode cluster
--num-executors 80 \
--driver-memory 6g \
--executor-memory 6g \
--executor-cores 3 \
/usr/opt/modules/spark/jar/spark.jar \
可以进行分配的资源如表所示:
名称
说明
--num-executors
配置 Executor 的数量
--driver-memory
配置 Driver 内存(影响不大)
--executor-memory
配置每个 Executor 的内存大小
--executor-cores
配置每个 Executor CPU core 数量

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据翻身

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值