问题
现象:生产bug ,定时任务不执行
经过排查发现是定时任务最开始的防止并发的锁,每次获取锁都是false进行了return。
RLock rLock = redissonUtil.getRedisLock(key);
if (!rLock.tryLock()) {
return;
}
经过观察redis发现,1、如果定时任务执行时间比锁过期时间短,这个锁会一直存在redis中,寿命是30s,而且每次降低到20s的时候又会增加到30s。
2、使用debug使得定时任务执行得比锁的过期时间长,这个锁才会消失。
结论:
rlock机制的参考链接
原来这是Rlock的看门狗机制,防止线程还持有锁的时候,锁的默认时间30s到期,导致其他线程获取到锁。
看门狗的机制是通过获取锁的线程来判断是否需要续期的,而尴尬的是springboot的schedule的定时任务都是一个线程管理的。
springboot的schedule定时任务是否都是一个线程的参考链接
所以这个定时任务执行了一次,但是rlock一直判定这个线程持有锁,一直都没能执行第二次。
但是情况2还没找到原因,怀疑是debug使得操作时间长的话,watchdog的定时任务没有机会执行,所以锁正常过期。
解决方法:
手动释放锁:1、设置超时时间 2、写释放锁的代码
考虑到测试情况2,debug的时候锁没有续期,释放锁的代码获取不到当前线程锁会报错,不利于使用,还是手动设置超时时间。实际业务中定时任务执行时间不会超过10s,给这个锁手动设置过期10s。