基于spark之上的即席分析-spark内存泄漏及源码调优

spark 内存泄露

  1. 高并发情况下的内存泄露的具体表现 
    很遗憾, spark 的设计架构并不是为了高并发请求而设计的,我们尝试在网络条件不好的集群下,进行 100 并发的查询,在压测 3 天后发现了内存泄露。 
    a) 在进行大量小 SQL 的压测过程中发现,有大量的 activejob 在 spark ui 上一直处于 pending 状态,且永远不结束,如下图所示 
    这里写图片描述 
    b) 并且发现 driver 内存爆满 
    这里写图片描述 
    c) 用内存分析分析工具分析了下 
    这里写图片描述
  2. 高并发下 AsynchronousListenerBus 引起的 WEB UI 的内存泄露 
    短时间内 Spark 提交大量的 SQL ,而且 SQL里面存在大量的 union与 join的情形,会创建大量的 event对象,使得这里的 event 数量超过 10000 个 event ,一旦超过 10000 个 event 就开始丢弃 event,而这个 event 是用来回收 资源的,丢弃了 资源就无法回收了。 针对 UI 页面的这个问题,我们将这个队列长度的限制给取消了。 
    这里写图片描述 
    这里写图片描述

  3. AsynchronousListenerBus 本身引起的内存泄露 
    抓包发现 
    这里写图片描述 
    这里写图片描述 
    这些 event 是通过 post 方法传递的,并写入到队列里 
    这里写图片描述 
    但是也是由一个单线程进行 postToAll 的 

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值