小白这周遇到生产问题主要和定时任务有关,springboot的@Scheduled注解的定时任务明明定义的cron表达式是每隔3分钟执行1次,结果搜日志发现不一定按照这个执行,而且最近一次执行到28日19:12分之后就没再执行了,小白经过2天的漫长分析发现对这个注解定时任务的认识太浅薄了,只知道用,却不止所以然,遇到问题就傻眼了....记录下来原因
第一、定时任务为什么突然不执行了?
即便执行比较慢,应该也有终止的时候吧?结果发现28日之后有个定时任务就不执行了,用jstack查看堆栈信息,发现定时任务有阻塞。再结合代码中的sql,到生产表执行发现执行时间巨长...
数据库中show processlist发现定时任务的sql还在执行,那这个慢sql就是定时任务阻塞的罪魁祸首了!即刻开始优化,否则即便kill掉,后面应用重启定时任务再次触发还会有慢sql导致阻塞
第二、定时任务为什么没有按照计划的cron表达式执行
项目中的cron表达式是 0 */3 * * * ?
也就是预期计划是:每隔3分钟的0秒开始执行定时任务,但发现实际并非如此,有2个比较诡异的地方:
(1)日志发现有少量并非0秒执行的,对此小白也是一头雾水。通过网上查询得知springboot默认是单线程执行定时任务,如果有的定时任务执行时间比较长,会影响其他定时任务的执行,也就是说执行会延迟。引用另一篇说的比较清楚,springboot项目中定时任务注解@Scheduled未按cron表达式执行_scheduling 配置了cron表达式,但是没有按照频率执行-CSDN博客
(2)日志发现并不是每3分钟就执行了定时任务
如果定时任务执行时间超长,比如定义的每隔3分钟执行1次,结果执行时间超过3分钟,则下一个触发时间点并不会执行,同(1)默认单线程执行
第三、定时任务逻辑最好try catch异常
拿除数0示例,会报以下错误:不影响其他定时任务执行,线程池会处理定时任务异常
ERROR [scheduling-1] o.s.s.s.TaskUtils$LoggingErrorHandler [?:?] Unexpected error occurred in scheduled task
第四、定时任务逻辑注意耗时
比如对数据的处理,如果是删除,则先分页查询到主键,再逐个删除,这样做避免数据量大时delete操作锁表影响正常业务