一次定时任务不执行情况分析

一、业务表现

在业务容器中,存在如下三个进程:

  • JAVA应用进程
  • OBProxy进程
  • Agent进程

其中Agent进程会启动一个守护线程,定时检查OBproxy进程的状态,如果OBproxy进程挂了,会重新拉起该进程。

现象

业务容器发生OOM,linux OOM killer主动kill掉了OBProxy进程。

Agent的守护线程未按照预期拉起OBproxy进程。

对应Agent简化版代码如下:

ScheduledExecutorService executorService = Executors.newSingleThreadScheduledExecutor();

        executorService.scheduleWithFixedDelay(() -> {
            try {
                if (obProxyProcessDown) {
                    pullObProxyProcess();
                }
            } catch (Exception e) {
                //LOG
            }
        }, 1, 1, TimeUnit.SECONDS);

使用ScheduledExecutorService#scheduleWithFixedDelay定时检查OBproxy进程状态,在OBproxy进程挂掉的情况下主动拉起。

二、原因

如上简化代码,ScheduledExecutorService#scheduleWithFixedDelay里定时任务Task#catch的异常类型是Exception,但是系统OOM那会,抛出的是OOM Error异常,Error > Exception,没Catch住,导致ScheduledExecutorService线程池里的后续任务不执行。

三、复现在这里插入图片描述

OOM后,后续的打印动作并未执行。

四、分析在这里插入图片描述

定时任务执行异常,上面的java.util.concurrent.FutureTask#runAndReset返回false,导致后续的reExecutePeriodic未执行,定时任务没加入到BlockingQueue中,表现就是:后续定时任务不会执行。

具体可以参考:任务异常导致线程池中的线程变为waiting状态

其他:一次spring定时任务阻塞的情况

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值