如何合理设置spark-submit参数

最新推荐文章于 2024-07-10 08:00:00 发布

zx_love

最新推荐文章于 2024-07-10 08:00:00 发布

阅读量1.8k

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zx_blog/article/details/79151367

版权

大数据专栏收录该内容

16 篇文章 0 订阅

订阅专栏

基础的一些参数：

--executor-cores 2（每台机器核数）

--num-executors 20 （executor 节点数，不要太多5-20，如果程序涉及数据交换较多，节点数过多会，大量shuffle write需要跨机器网络传输数据，影响实际执行效率；同时与集群资源有关，申请资源需要合理，不要影响其他业务；集群网络不佳时，节点数过多会扩大对执行效率的影响）

--driver-memory 12g （主节点内存，根据主节点数据量设置）

--executor-memory 10g （每个节点内存，根据总数据量设置）

--conf spark.yarn.maxAppAttempts=1 （失败重试次数，默认重试4次，前期任务调试阶段，重试次数最好设置为1，可以较快得到执行结果；后期业务上线，也使用默认参数）

--conf spark.default.parallelism=100 （一般不设置，或根据cores和executors计算，cores*executors的2-3倍）

--conf spark.shuffle.memoryFraction=0.6 （shuffle内存占比，默认0.2 即20%，视实际情况进行调整）

--conf spark.storage.memoryFraction=0.2 （每个节点数据存储内存占比，默认0.6 即60%，可根据程序rdd的cache持久化设置大小）

详细进一步参考点击打开链接 http://www.uml.org.cn/bigdata/2016060810.asp

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zx_love CSDN认证博客专家 CSDN认证企业博客

码龄11年

78: 原创

5万+: 周排名

104万+: 总排名

24万+: 访问

: 等级

2387: 积分

31: 粉丝

45: 获赞

9: 评论

171: 收藏

私信

关注

热门文章

分类专栏

大数据 16篇
Java 10篇
HIVE 5篇
python 1篇
数据库 4篇
贪心 5篇
ACM 36篇
动态规划 3篇
并查集 10篇
最小生成树 2篇
模拟 1篇
数位DP 5篇
线段树 5篇
母函数 7篇
游戏设计 1篇
BFS

最新评论

实现童年梦想——RPG游戏入门（RPG制作大师使用教程）
weixin_43770616: 感谢
Hadoop与Spark并行度设置问题（mr、spark任务提交参数的设置、spark-submit参数调优）
zx_love 回复 Ink__Bamboo: 读取文件的并行度是取决于文件存储的block数量；spark任务执行的并行度是根据spark参数、spark执行算子中指定的并行度来控制的（如果不指定，那默认实际执行的并行度和文件读取的并行度是一致的）。意义是在于，很多人在spark任务实际执行的算子中不去指定这个并行度，导致实际执行的并行度是由文件存储时block数决定，导致并行度的不合理；如果一个会被经常使用的文件他的block数不合理，建议是重新读写一遍，重新改变他的并行度，可以避免每次使用时需要重分区的shuffle操作
Hadoop与Spark并行度设置问题（mr、spark任务提交参数的设置、spark-submit参数调优）
Ink__Bamboo: 如果spark启动并行度大于读取文件的block数量，那实际的并行度是多少啊？？若读取文件block数远大于并行度那实际的并行度又是多少啊
实现童年梦想——RPG游戏入门（RPG制作大师使用教程）
凌晨小街: 博主，我按照你的来调试为什么没有npc啊
实现童年梦想——RPG游戏入门（RPG制作大师使用教程）
凌晨小街: 大佬感谢啊

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。