Spark调优常用配置参数

最新推荐文章于 2024-08-16 10:02:14 发布

pyiran

最新推荐文章于 2024-08-16 10:02:14 发布

阅读量893

点赞数 3

分类专栏： Spark 文章标签： spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/littlePYR/article/details/105200287

版权

本文分享了Spark调优的关键点，包括基本配置参数设置、调整timeout和retry策略、优化JVM参数以及启用dynamicAllocation。通过合理配置，提升Spark应用的性能和资源利用率。

摘要由CSDN通过智能技术生成

最近看到一篇不错的关于Spark内存调优的blog,分享一下：
https://idk.dev/best-practices-for-successfully-managing-memory-for-apache-spark-applications-on-amazon-emr/
这篇blog主要提出了几种Spark内存调优方式（基于的是Amazon EMR总结的，但是我觉得通用性还是很强），的确是平时会遇到的情况，在这里就不做通篇的翻译了，我在这里结合自己遇到的情况大概总结一些，详细的大家可以自己去看原文。

Spark调优基本配置参数

以下几个参数是最基本的job调优参数，只有把这几个参数设置的比较合适之后，我们才有更进一步的优化。

property name	Default	Meaning
spark.executor.memory	1g	Amount of memory to use per executor process, in the same format as JVM memory strings with a size unit suffix (“k”, “m”, “g” or “t”) (e.g. 512m, 2g).
spark.driver.memory	1g	Amount of memory to use for the driver process, i.e. where SparkContext is initialized, in the same format as JVM memory strings with a size unit suffix (“k”, “m”, “g” or “t”) (e.g. 512m, 2g). Note: In

最低0.47元/天解锁文章

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

pyiran CSDN认证博客专家 CSDN认证企业博客

码龄8年

16: 原创

40万+: 周排名

150万+: 总排名

3万+: 访问

: 等级

487: 积分

17: 粉丝

84: 获赞

5: 评论

42: 收藏

私信

关注

热门文章

分类专栏

Spark 8篇
Hadoop 1篇
Docker 2篇

最新评论

HDFS的扩展属性(Extended Attribute)使用详解
被迫的开: 扩展性值，我用postman怎么传扩展性值
部署Spark History Server到K8s
pyiran: job 日志，你是指spark job的日志么，这个在History server上只记录了log的link，至于log link是否可以访问，需要特定处理。
部署Spark History Server到K8s
ganliang13: 您好，我通过这种方式配置后，k8s已经可以访问historyServer，但是跑数据时，没有将job日志关联到historyServer.
Spark调优常用配置参数
看得出的就是: 实际使用中，发现spark动态资源分配还是存在不少问题，尤其是稳定性，不知博主怎么看？
Spark History Server性能改进（一）-- 应用列表
向彪-blockchain: 原创不易，继续加油，已收藏。方便的话可以加个关注。共同学习！一起进步！

大家在看

zblog自适应单款游戏推广主题

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。