最近在SPARK上定位的几个内存泄露问题总结

最新推荐文章于 2024-07-17 23:45:30 发布

qq_33160722

最新推荐文章于 2024-07-17 23:45:30 发布

阅读量7.4k

点赞数 5

文章标签： spark 全文检索 hadoop lucene 内存泄露

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33160722/article/details/54092560

版权

本文总结了在高并发场景下，Spark存在的内存泄露问题，包括AsynchronousListenerBus、Cleaner、线程池与ThreadLocal、文件泄露、deleteOnExit、JDO内存泄露和Listener的内存泄露。并详细介绍了每个问题的成因及相应的解决策略，如调整配置、限制SQL执行等待队列长度和改进线程池实现等。

摘要由CSDN通过智能技术生成

最近为了测试延云YDB在高并发请求和持续性请求情况下的表现，发现了spark的不少关于内存泄露的问题，这些问题均在延云YDB提供的SPARK版本中得以修正，现将问题总结如下。

1. 高并发情况下的内存泄露

很遗憾，spark的设计架构并不是为了高并发请求而设计的，我们尝试在网络条件不好的集群下，进行100并发的查询，在压测3天后发现了内存泄露。
a) 在进行大量小SQL的压测过程中发现，有大量的activejob在spark ui上一直处于pending状态，且永远不结束，如下图所示

b) 并且发现driver内存爆满

c) 用内存分析分析工具分析了下

2. 定位到最终内存泄露的原因以及解决办法

1) AsynchronousListenerBus引起的WEB UI的内存泄露
短时间内 SPARK 提交大量的SQL ，而且SQL里面存在大量的 union与join的情形，会创建大量的event对象，使得这里的 event数量超过10000个event ，

一旦超过10000个event就开始丢弃 event，而这个event是用来回收资源的，丢弃了资源就无法回收了。针对UI页面的这个问题，我们将这个队列长度的限制给取消了。

最低0.47元/天解锁文章

关注

5
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qq_33160722 CSDN认证博客专家 CSDN认证企业博客

码龄9年

56: 原创

157万+: 周排名

140万+: 总排名

13万+: 访问

: 等级

1831: 积分

44: 粉丝

40: 获赞

14: 评论

65: 收藏

私信

关注

热门文章

最新评论

基于spark的车辆分析
仙姝: hphm 车牌号 kkbh 卡扣编号 jgsj 时间？ jgsk 时间？ quyu 区域其中jgsj和jgsk分别是什么时间啊？
YDB与spark SQL在百亿级数据上的性能对比测试
weixin_44150938: YDB的表，在创建外部表时，创建了1张排序表，1张非排序表，然后查询时自动识别有排序字段，去查了已排好序的表。这有比较性。我SPARK也创建两张表，一张排序好的，一张未排序的，再试试呢？
YDB与spark SQL在百亿级数据上的性能对比测试
daodao072: 都是单表，没有列出来子查询和多表复杂查询，甚至连两表的join 都没有，如果能够列出一些复杂sql的性能，才更具有说服力
20170405YDB资源汇总
zhugehengheng: 为啥都404了呢
记一次kafka数据丢失问题的排查
奋斗青年myl: mark

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。