ScheduledThreadPoolExecutor遇到的坑

线上表象:

在项目中,有这样一个需求,将内存事件队列的事件定时上传到阿里云事件监控,使用ScheduledThreadPoolExecutor定时去拉取内存队列事件调用阿里云接口处理。

// 初始化本地任务内存事件队列
LinkedBlockingQueue<EventEntry> eventQueue = new LinkedBlockingQueue<>(10000);
// 初始化定时任务线程池
ScheduledExecutorService schedule = new ScheduledThreadPoolExecutor
(1,new BasicThreadFactory.Builder().namingPattern("aliyun-event-pool-%d").daemon(true).build());
schedule.scheduleAtFixedRate(this, 5, 1, TimeUnit.SECONDS);

重写ScheduledExecutorService的run方法:

public void run() {
        do {
           batchPut();
        } while (this.eventQueue.size() > 10);
    }

线上发现本地内存队列已经堆满了,但是定时任务线程池不消费。查询线程状态:

"aliyun-event-pool-1" #33 daemon prio=5 os_prio=0 tid=0x00007f5feaf298e0 nid=0x6ec3 waiting on condition [0x00007f5fa9dfc000]
   java.lang.Thread.State: TIMED_WAITING (parking)
	at sun.misc.Unsafe.park(Native Method)
	- parking to wait for  <0x0000000741e48250> (a java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject)
	at java.util.concurrent.locks.LockSupport.parkNanos(LockSupport.java:215)
	at java.util.concurrent.locks.AbstractQueuedSynchronizer$ConditionObject.awaitNanos(AbstractQueuedSynchronizer.java:2078)
	at java.util.concurrent.ScheduledThreadPoolExecutor$DelayedWorkQueue.take(ScheduledThreadPoolExecutor.java:1093)
	at java.util.concurrent.ScheduledThreadPoolExecutor$DelayedWorkQueue.take(ScheduledThreadPoolExecutor.java:809)
	at java.util.concurrent.ThreadPoolExecutor.getTask(ThreadPoolExecutor.java:1067)
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1127)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:617)
	at java.lang.Thread.run(Thread.java:745)

发现线程池处于等待状态中,线程处于等待唤醒状态,相应的源代码如下:

在这里插入图片描述

为什么会在这里等待呢?这明显是线程池队列中没有任务了嘛,具体原因这得从ScheduledThreadPoolExecutor源码说起

public ScheduledFuture<?> scheduleAtFixedRate(Runnable command,long initialDelay, long period,TimeUnit unit) {
        //数据校验
        if (command == null || unit == null)
            throw new NullPointerException();
        if (period <= 0)
            throw new IllegalArgumentException();
        //将Runnable包装成ScheduledFutureTask
        ScheduledFutureTask<Void> sft = new ScheduledFutureTask<Void>(command, null,triggerTime(initialDelay, unit),unit.toNanos(period));
        RunnableScheduledFuture<Void> t = decorateTask(command, sft);
        sft.outerTask = t;
        //延迟执行
        delayedExecute(t);
        return t;
    }

在上述代码中,将上游传过来的Runnable封装成ScheduledFutureTask,ScheduledFutureTask继承自FutureTask,线程池调度执行时,执行的即是ScheduledFutureTask中的run方法。下面来看delayedExecute方法:

private void delayedExecute(RunnableScheduledFuture<?> task) {
        if (isShutdown())
            reject(task);
        else {
            //往队列中添加任务
            super.getQueue().add(task);
            if (isShutdown() &&
                !canRunInCurrentRunState(task.isPeriodic()) &&
                remove(task))
                task.cancel(false);
            else
                //预启动线程池中的一个Worker
                ensurePrestart();
        }
    }

线程启动后,由ScheduledThreadPoolExecutor的父类ThreadPoolExecutor接管。

ThreadPoolExecutor

在上一步的ensurePrestart启动线程池中的Worker后,即通过Worker的run方法执行runWorker:

final void runWorker(Worker w) {
        //...
        try {
            while (task != null || (task = getTask()) != null) {
                //...
                if ((runStateAtLeast(ctl.get(), STOP) ||(Thread.interrupted() &&runStateAtLeast(ctl.get(), STOP))) &&\!wt.isInterrupted())wt.interrupt();
                try {
                    beforeExecute(wt, task);
                    Throwable thrown = null;
                    try {
                        task.run();
                    //...
                } finally {
                   //...
                }
            }
            completedAbruptly = false;
        } finally {
            processWorkerExit(w, completedAbruptly);
        }
    }

根据之前导出的线程状态,就是从此处的getTask()开始。在消费任务的时候等待,那么肯定是生产不足导致,下面我们继续寻找生产任务的地方。
当有任务时,会执行任务的run方法,在这里,即是ScheduledFutureTask的run方法:

public void run() {
            //是否周期调度
            boolean periodic = isPeriodic();
            //是否可运行
            if (!canRunInCurrentRunState(periodic))
                cancel(false);
            else if (!periodic)
                ScheduledFutureTask.super.run();
            //运行,并设置下次任务
            else if (ScheduledFutureTask.super.runAndReset()) {
                setNextRunTime();
                reExecutePeriodic(outerTask);
            }
        }

runAndReset代码如下:

protected boolean runAndReset() {
        if (state != NEW || !UNSAFE.compareAndSwapObject(this,runnerOffset,null, Thread.currentThread()))
            return false;
        boolean ran = false;
        int s = state;
        try {
            Callable<V> c = callable;
            if (c != null && s == NEW) {
                try {
                    c.call(); // don't set result
                    ran = true;
                } catch (Throwable ex) {
                    setException(ex);
                }
            }
        } finally {
            runner = null;
            s = state;
            if (s >= INTERRUPTING)
                handlePossibleCancellationInterrupt(s);
        }
        return ran && s == NEW;
    }

reExecutePeriodic代码如下:

void reExecutePeriodic(RunnableScheduledFuture<?> task) {
        if (canRunInCurrentRunState(true)) {
            super.getQueue().add(task);
            if (!canRunInCurrentRunState(true) && remove(task))
                task.cancel(false);
            else
                ensurePrestart();
        }
    }

在周期调度时,首先先执行runAndReset执行最初设置的Runnable代码,若代码成功执行,则返回true,否则返回false(runnable中的代码拋出异常)。而只有当返回true时,执行reExecutePeriodic代码,在reExecutePeriodic代码中,super.getQueue().add(task)即是任务的生产。而当runAndReset返回false时,则不再往Queue中添加task,此时再执行getTask()中的take()时,由于队列为空,所以线程变为等待唤醒,但已没有任何地方再添加task,所以不再定时调度。

结论

通过查看scheduleAtFixedRate的jdk文档,有一句如下:

If any execution of the task encounters an exception, subsequent executions are suppressed.
如果在任务的执行中遇到异常,后续执行被取消。

不禁有个疑问,为什么要这么设计呢?这次任务失败并不一定意味着下一次会失败啊。
个人是这样的看法:java不想去猜你的异常会怎样,要求你必须把自己的异常处理好,这样让自己更专注的做调度,而无须关心调度的逻辑。

ScheduledThreadPoolExecutor的最优实践:
将所有执行代码用try-cache包裹,如下:

@Override
    public void run() {
        do {
            try{
                batchPut();
            }catch (Exception e){
              // 异常处理
            }
        } while (this.eventQueue.size() > 10);
    }
  • 1
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值