业务大概是这样的,首先有一个提交流程锁,锁的超时时间只有5s(可以用于防刷),获取到提交流程锁之后,才可以去获取业务锁,然后执行业务rpc调用,并且这个逻辑下,业务锁的超时时间设置成了10000s(可以理解为作为降低调用第三方rpc幂等调用量的锁工具),一但判断该业务锁已经锁上则不再进行调用直接走后续逻辑。
今天出现的问题是,业务锁由于超时等原因返回了锁定失败,然而实际在redis已经锁定成功,这样导致没有调用第三方rpc,并且业务流程往下执行,直到很后面的步骤才弹出失败。
解决方案就是判断占据业务锁失败时手动删除业务锁,这样会不会引出另外一个问题,比如并发情况下,两个线程都判断此时没有锁,然后一个加锁失败,一个加锁成功,加锁失败的去释放锁,岂不是释放掉了另外一个成功请求的锁?首先一定要做业务幂等,避免这种锁被释放后又来线程进行rpc调用,另外这种情况可以在加锁时,value值使用uuid当场生成,直接删除value为指定值的业务锁。但其实在我现在这个业务场景下,有一个提交流程锁(只有当前请求的所有操作全部结束才会释放),可以基本避免这种并发情况。
因此本次的解决方案为:业务锁加锁失败时,执行解锁业务锁命令。