线程池误用case study

事故过程记录

  1. 研发收到压测通知,梳理性能瓶颈点时,发现线程池配置可能存在性能风险。调整线程池参数,将queueCapacity由200调整为1
  2. 收到线上接口调用失败率告警
  3. 开始排查问题,发现线程池报大量reject异常(java.util.concurrent.RejectedExecutionException),导致接口调用失败率飙升在这里插入图片描述
  4. 回滚线程池配置参数,将queueCapacity由1恢复为100
  5. 报警日志逐渐减少,接口调用成功率恢复正常

复盘

  1. 为什么要调整queueCapacity由100调整为1?
    因为当时看到线程池核心线程数(256),最大线程数=2000,担心遇到流量突刺时,不增加线程数,而是将任务放入队列,队列中的任务可能会因为等待而超时。
  2. 为什么会报reject异常?
    该场景为CPU密集型,将线程池的等待队列调整为1后,导致并发线程数量在超过coreThreadCount后继续创建新线程,并很快使线程数量达到maxThreadCount,最终导致reject异常,下图为Java原生线程池创建线程的流程图
    在这里插入图片描述

总结

  1. 线程池的细节很多,调整不当很容易踩坑,那么线程池的等待队列大小怎么调整,什么时候设置大一些,什么时候设置小?

可以分两类来看

  1. CPU密集型,将queueCapacity调大一些,减少线程上下文切换时间
    因为执行CPU密集型的任务时CPU比较繁忙,因此只需要创建和CPU核数相当的线程就好了,多了反而会造成线程上下文切换,降低任务执行效率。所以当前线程数超过核心线程数时,线程池不会增加线程,而是放在队列里等待核心线程空闲下来。
  2. IO型,将queueCapacity调小一些,避免线程池不满但是任务却一直不执行的诡异现象
    我们平时开发的Web系统通常都有大量的IO操作,比方说查询数据库、查询缓存等等。任务在执行IO操作的时候CPU就空闲了下来,这时如果增加执行任务的线程数而不是把任务暂存在队列中,就可以在单位时间内执行更多的任务,大大提高了任务执行的吞吐量。所以你看Tomcat使用的线程池就不是JDK原生的线程池,而是做了一些改造,当线程数超过coreThreadCount之后会优先创建线程,直到线程数到达maxThreadCount,这样就比较适合于Web系统大量IO操作的场景了,你在实际使用过程中也可以参考借鉴。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

左林右李02

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值