使用现状
Redis分布锁的基础内容,我们已经在基于AOP和Redis实现的简易版分布式锁这篇文章中讲过了,也在文章中示范了正常的加锁和解锁方法。
分布式锁在之前的项目中一直运行良好,没有辜负我们的期望。
发现问题
但在最近查线上日志的时候偶然发现,有一个业务场景下,分布式锁偶尔会失效,导致有多个线程同时执行了相同的代码。
我们经过初步排查,定位到是因为在这段代码中间调用了第三方的接口导致。
因为业务代码耗时过长,超过了锁的超时时间,造成锁自动失效,然后另外一个线程意外的持有了锁。于是就出现了多个线程共同持有锁的现象。
解决方案
问题既然已经出现了,那么接下来我们就应该考虑解决方案了。
我们也曾经想过,是否可以通过合理地设置LockTime(锁超时时间)来解决这个问题?
但LockTime的设置原本就很不容易。LockTime设置过小,锁自动超时的概率就会增加,锁异常失效的概率也就会增加,而LockTime设置过大,万一服务出现异常无法正常释放锁,那么出现这种异常锁的时间也就越长。我们只能通过经验去配置,一个可以接受的值,基本上是这个服务历史上的平均耗时再增加一定的buff。
既然这条路走不通了,那么还有其他路可以走么?
当然还是有的,我们可以先给锁设置一个LockTime,然后启动一个守护线程,让