Quartz 集群环境下任务重复执行以及任务丢失
问题现象1:同一个时刻任务在两个集群节点分别执行了一次;
问题现象2:定时任务会出现意外的丢失;
问题现象3:暂停任务一段时间后,重新启用任务,发现被暂停期间的任务在启动后都被重新执行了一遍;
注:quartz版本为2.3.0,且使用JDBC模式存储Job:org.quartz.jobStore.class: org.quartz.impl.jdbcjobstore.JobStoreTX
Quartz是OpenSymphony开源组织在Job scheduling领域又一个开源项目,它可以与J2EE与J2SE应用程序相结合也可以单独使用。Quartz可以用来创建简单或为运行十个,百个,甚至是好几万个Jobs这样复杂的程序。
misfire 原理分析
任何系统都无法保证100% 在规定的时间内执行,在执行过程肯定会遇到种种问题(比如系统繁忙,无可用线程)导致任务延迟;在quartz 中 把这些延迟的任务称为misfire 任务,在quartz 中的任务延迟执行有个阀值(默认60s)当延迟超过这个阀值,当前任务被划入misfire 中;将不能正常的执行;所以quartz 为了保证不丢去任务,有相应策略来处理这些 misfire任务;业务系统中可以根据自己业务的场景来决定这些misfire 的任务丢弃还是在执行;
下面将分析源码中对misfire 的处理
在quratz 中 专门一个线程 MisfireHandler extends Thread
用来发现这些misfire的任务;
@Override
public void run() {
在线程启动后将不断轮训
while (!shutdown) {
long sTime = System.currentTimeMillis();
//这里是关键的地方:获取misfire 的任务,并根据不同的misfire的策略去处理相应的任务
RecoverMisfiredJobsResult recoverMisfiredJobsResult = manage();
if (recoverMisfiredJobsResult.getProcessedMisfiredTriggerCount() > 0) {