spark调优

最新推荐文章于 2022-07-25 09:00:43 发布

忘川风华录

最新推荐文章于 2022-07-25 09:00:43 发布

阅读量200

点赞数

分类专栏： spark 文章标签： spark spark调优

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36968512/article/details/85043779

版权

spark 专栏收录该内容

15 篇文章 0 订阅

订阅专栏

程序开始前我看从以下四方面设置
1.executor-memory
这个参数是设置分配任务总内存的
2.excutor-cores
设置集群的总核心数
3.num-excutors
申请的excutor的数据，最好和分区数量成倍数。
4.repartition
官网建议为excutors的2-3倍
详细见下图：
在这里插入图片描述

程序运行结束之后我们看看spark的UI界面，因为只是看输入日志能难判断出程序在哪里耗费时间比较长，一般是从两点判断
一是序列化,如果序列化时间过长，肯定不行，
二是GC，gc时间过长肯定也不行

忘川风华录

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark调优

首先我们应该对spark的UI界面很熟悉，因为只是看输入日志能难判断出程序在哪里耗费时间比较长，一般是从两点判断一是序列化,如果序列化时间过长，肯定不行，二是GC，gc时间过长肯定也不行...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。