线上服务OOM解决记录

线上服务出现OOM,导致服务假死。经过排查,发现并非vertx web框架内存泄露,而是线程池配置不当。具体表现为业务线程阻塞,线程池队列设置过长,加之并发量增加和内存配置不足,引发问题。解决方案是调整线程池参数,增加内存配置,以及优化线程使用。
摘要由CSDN通过智能技术生成

 

     最近线上运行的两个服务都出现了oom的情况,具体的报错在于线程池创建线程时 内存不够用导致服务假死。 实际追查过程中才发现问题根本不是内存泄露,而是对于部分参数的设置存在问题。因此记录一下查找问题的过程。

    1,第一时间发现线上部分请求出现超时不回包的问题,发现服务里面存在oom的情况,  查看代码的部署记录,  服务线上部署了5个节点,并且已经正常运行了2个月,其它4个节点正常运行。从nginx上,将服务节点放下来,然后分析问题。

    2,dump出内存堆栈信息,通过jhat分析堆栈信息,发现内存当中存在大量的vertx  web框架的Context对象,初步怀疑是vertx web框架的内存泄露导致的问题。(因为这个诊断导致走了弯路)

  怀疑1 :  vertx web框架存在问题 

   3, 对vertx web框架做了压测,发现vertx web没有存在内存泄露的问题。

   4, 查看了vertx web框架中出现内存泄露的上线问信息。发现一个问题点,  vertx web的work线程队列是与socket绑定的,怀疑可能是nginx反向代理的时候,是开启了keepavliede, 可能会导致同一时间的所有请求都发送到一个work线程上,导致内存溢出。

   怀疑2 :  怀疑vertx web框架的work线程分配有问题,同一个socket大量请求会堵塞线程队列。(从实际上看,这种怀疑是站不住脚的,以内http协议,即使开通了keepalive,一个socket也是一个一个请求-应答,不会同时传递多个请求过来)。

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值