记一次线上tomcat worker线程在一个流量高峰后居高不下的问题及排查解决过程

一天晚上有一个跑批任务要执行,这个任务可能会引发一个较大的流量并发到我们的一个应用服务。
果然不出意外,当天晚上9点半,这个应用服务的某个接口每秒请求量到达了150左右。这时调用方出现
大量等待超时,我们的这个应用服务则报出了大量获取数据库连接超时的异常。翻开日志一看原来是数据
库连接池Hikari从连接池获取空闲连接超时了。至于为什么Hikari会获取连接超时,后面分析。
    好在这种高并发的访问只是顺时的,5分钟后恢复了平静报警也消失了,但问题并没有就此结束。不
一会正常的业务访问该接口也频繁出现超时,但这时的并发却不超过10啊,怎么会出现这么奇怪的现象呢,
通过skywalking链路监控工具查看调用链发现是上游rpc调用等待超时时间是15秒,而我们服务处理时间
超过了20秒,再配合在Kibana上查询相关访问日志,发现是上游请求发出后将近20秒,请求才进入处理流
程。我的第一反应就是tomcat的处理请求的worker线程不够用了,使请求进入了等待队列,但现在并发又
不高为什么会worker线程不够用了。赶紧去Grafana面板查看我们应用的当前运行状况,不看不知道一看
吓一跳,当前处于busy状态的tomcat worker线程已经高达192了,而我们设置的tomcat maxThreads
为200。事情不简单啊,基本上确认是刚才瞬间高并发导致的,因为之前时间线busy线程都不超过10。
    为什么会导致这样的情况呢,先来不及思考这些问题了,先让服务恢复正常才首要任务。赶紧联系运维
帮忙重启应用,并在重启前做好dump。重启后tomcat busy线程数恢复了正常,接口超时现象也没有了。
接下来就该分析为什会经过一个流量高峰后,tomcat 线程池中的线程为什么得不到回收并且处于非空闲
状态。拿到dump文件后,分析了下当时的线程状态,发现tomcat
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值