Seata 之 @GlobalLock 是AT模式下隔离性保障神器之一【保熟】

最新推荐文章于 2025-02-23 23:52:17 发布

原创最新推荐文章于 2025-02-23 23:52:17 发布 · 1k 阅读

2 ·

CC 4.0 BY-SA版权

文章标签：

#java #spring #mybatis

一、概述

Seata AT模式下，如果服务A(服务接口或方法)参与全局事务，即在全局事务中作为一个分支事务，那么会在 TC 侧添加行锁记录，用于保障全局事务的隔离性。但还有另外一种情况，如果某个服务B从调用上下文上看，并未与其他服务一起协作，而是一个独立的逻辑，但与其他参与全局事务的服务都操控表C中的记录；这种情况下如没有处理好隔离性，会导致服务A无法完成二阶段回滚；如服务A在参与全局事务在一阶段修改了表C中的D记录，服务B也修改了表C中的D记录。但服务A所参与的全局事务在二阶段决议要回滚，而服务A要回滚时发现数据变了（被服务B修改了，即脏写），不满足回滚的条件。

解决这个问题有两种办法，一是服务B也通过@GlobalTransaction注解接入全局事务，这种方式需要向 TC 注册分支事务，增加交互；Seata提供了另外一种方案，使用@GlobalLock注解。@GlobalLock注解内部的逻辑是Seata通过Connection代理，在commit环节增强处理逻辑，检测不到冲突的全局行锁记录后，才提交本地事务；若检测到冲突的全局行锁记录就重试，@GlobalLock注解中的lockRetryInternal为重试间隔，lockRetryTimes为重试次数。

二、关键逻辑导读

GlobalTransactionScanner#wrapIfNecessary扫描 spring bean 时，判断是否有@GlobalLock注解，识别到方法上的@GlobalLock注解后，给 bean 加上 AOP 拦截器GlobalTransactionalInterceptor。
拦截器的invoke方法内部是委托给GlobalLockTemplate#execute在执行业务逻辑方法之前，在ThreadLocal中打上需要全局行锁判断的标记
接下来，在处理业务逻辑执行中的 SQL 时，因 AT 模式是代理数据源做增强，即在处理 SQL 的环节，体现在BaseTransactionalExecutor#execute方法内。关键逻辑是如果从ThreadLocal中识别到需要全局锁的标记，才做全局行锁的判断处理
在上一步提到的BaseTransactionalExecutor#execute中的代码比较复杂，Seata的设计是在本地事务执行commit的前一步（前后镜像构建之后）才做全局事务锁的处理(这样可以减少持锁时间)，即ConnectionProxy#commit内的doCommit中，其内部因上下文不同有两种后续分支，一种是全局事务提交，一种是 globallock+本地事务提交。
globallock+本地事务提交这种情况的处理在代码processLocalCommitWithGlobalLocks()中，其中的逻辑是用ConnectionProxy#checkLock判断有冲突的全局行锁是否存在（本事务所操作的行记录构造成行锁记录是否跟在 TC 侧已存在的全局行锁记录有重复），不存在的情况下通过targetConnection.commit()提交本地事务；这个过程中并不会并不会并不会在 TC 中添加全局行锁记录。
如果ConnectionProxy#checkLock检测到全局行锁记录已存在的话，会抛出LockConflictException，方法外部捕获这个异常后重试，即在ConnectionProxy#doCommit外层的重试管理逻辑lockRetryPolicy.execute(() -> {doCommit();...})，
重试的次数以及间隔控制体现在方法lockRetryPolicy#doRetryOnLockConflict中，而这里的次数和间隔就是@GlobalLock注解中的lockRetryTimes和lockRetryInternal。
总结来说，@GlobalLock在检测不到冲突的全局事务行锁记录后，就提交本地事务，并没有插入全局行锁记录，也就是说在检测到没有冲突的全局行锁记录时，后续过程的隔离性是由本地事务来保障，即本地事务未提交的数据不会被其他的本地事务和分布式事务修改掉。

三、相关源码导读

@GlobalLock逻辑的关键代码分别体现在以下几处：

1） GlobalTransactionScanner#wrapIfNecessary扫描 spring bean 时，判断方法上是否有@GlobalLock注解，如果有则给这个 bean，添加拦截器GlobalTransactionalInterceptor，也就是说被 @GlobalTransactional 和 @GlobalLock 标注后，Seata 通过 AOP 增强提供的分布式事务能力在 GlobalTransactionalInterceptor 中

scss

复制代码

protected Object wrapIfNecessary(Object bean, String beanName, Object cacheKey) { // ... TCC 部分暂略 Class<?> serviceInterface = SpringProxyUtils.findTargetClass(bean); Class<?>[] interfacesIfJdk = SpringProxyUtils.findInterfaces(bean); // 判断类或方法上是否有@GlobalTransactional 注解 // 判断方法上有否有 @GlobalLock 注解 if (!existsAnnotation(new Class[]{serviceInterface}) && !existsAnnotation(interfacesIfJdk)) { return bean; } if (globalTransactionalInterceptor == null) { // 构建AOP的拦截器 GlobalTransactionalInterceptor globalTransactionalInterceptor = new GlobalTransactionalInterceptor(failureHandlerHook); // 运行时监听是否禁用分布式事务，如果禁用，那么拦截器中就不再使用分布式事务的能力 ConfigurationCache.addConfigListener( ConfigurationKeys.DISABLE_GLOBAL_TRANSACTION, (ConfigurationChangeListener)globalTransactionalInterceptor); } // 下方getAdvicesAndAdvisorsForBean 方法中，就返回这个interceptor， // 也就是说被 @GlobalTransactional 和 @GlobalLock 标注后，Seata通过AOP增强提供的分布式事务能力在 GlobalTransactionalInterceptor中 interceptor = globalTransactionalInterceptor; } LOGGER.info("Bean[{}] with name [{}] would use interceptor [{}]", bean.getClass().getName(), beanName, interceptor.getClass().getName()); // 如果是普通的bean，走父类的方法生成代理类即可 if (!AopUtils.isAopProxy(bean)) { bean = super.wrapIfNecessary(bean, beanName, cacheKey); } else { // 如果已经是代理类，获取到advisor后，添加到该集合即可 AdvisedSupport advised = SpringProxyUtils.getAdvisedSupport(bean); // 根据上面的interceptor生成advisor Advisor[] advisor = buildAdvisors(beanName, getAdvicesAndAdvisorsForBean(null, null, null)); int pos; for (Advisor avr : advisor) { // Find the position based on the advisor's order, and add to advisors by pos pos = findAddSeataAdvisorPosition(advised, avr); advised.addAdvisor(pos, avr); } } PROXYED_SET.add(beanName); return bean; } } catch (Exception exx) { throw new RuntimeException(exx); }

2）拦截器GlobalTransactionalInterceptor的invoke方法中，判断分布式事务能力未被禁用的情况下，将标注了@GlobalLock 的方法，交给handleGlobalLock(xxx)处理

java

复制代码

public Object invoke(final MethodInvocation methodInvocation) throws Throwable { //通过 methodInvocation.getThis() 获取当前方法调用的所属对象 //通过 AopUtils.getTargetClass(xx) 获取当前对象的Class Class<?> targetClass = methodInvocation.getThis() != null ? AopUtils.getTargetClass(methodInvocation.getThis()) : null; Method specificMethod = ClassUtils.getMostSpecificMethod(methodInvocation.getMethod(), targetClass); if (specificMethod != null && !specificMethod.getDeclaringClass().equals(Object.class)) { // BridgeMethodResolver.findBridgedMethod https://cloud.tencent.com/developer/article/1656258 final Method method = BridgeMethodResolver.findBridgedMethod(specificMethod); // 获取目标方法上 @GlobalTransactional 的信息 final GlobalTransactional globalTransactionalAnnotation = getAnnotation(method, targetClass, GlobalTransactional.class); // 获取目标方法上 @GlobalLock 的信息，@GlobalTransactional 和 @GlobalLock 不该同时存在 // @GlobalTransactional 是开启全局事务 // @GlobalLock 是按照全局事务的隔离级别查看数据 final GlobalLock globalLockAnnotation = getAnnotation(method, targetClass, GlobalLock.class); // 禁用了，或者开启了分布式事务能力降级，并且触发了降级的阈值 boolean localDisable = disable || (ATOMIC_DEGRADE_CHECK.get() && degradeNum >= degradeCheckAllowTimes); if (!localDisable) { if (globalTransactionalAnnotation != null || this.aspectTransactional != null) { AspectTransactional transactional; if (globalTransactionalAnnotation != null) { // 通过 @GlobalTransactional的信息构建全局事务的核心配置 transactional = new AspectTransactional(globalTransactionalAnnotation.timeoutMills(), globalTransactionalAnnotation.name(), globalTransactionalAnnotation.rollbackFor(), globalTransactionalAnnotation.rollbackForClassName(), globalTransactionalAnnotation.noRollbackFor(), globalTransactionalAnnotation.noRollbackForClassName(), globalTransactionalAnnotation.propagation(), globalTransactionalAnnotation.lockRetryInterval(), globalTransactionalAnnotation.lockRetryTimes(), globalTransactionalAnnotation.lockStrategyMode()); } else { transactional = this.aspectTransactional; } // 处理全局事务 return handleGlobalTransaction(methodInvocation, transactional); } else if (globalLockAnnotation != null) { // 处理全局锁 return handleGlobalLock(methodInvocation, globalLockAnnotation); } } } return methodInvocation.proceed(); }

3） handleGlobalLock方法中，采用模板方法模式，委托GlobalLockTemplate处理，通过@GlobalLock 注解中的值构建出GlobalLockConfig对象，用于控制全局锁获取的频率和尝试次数。把业务方法(methodInvocation.proceed())传入到globalLockTemplate.execute(...)中执行。

java

复制代码

private Object handleGlobalLock(final MethodInvocation methodInvocation, final GlobalLock globalLockAnno) throws Throwable { return globalLockTemplate.execute(new GlobalLockExecutor() { @Override public Object execute() throws Throwable { return methodInvocation.proceed(); } @Override public GlobalLockConfig getGlobalLockConfig() { GlobalLockConfig config = new GlobalLockConfig(); config.setLockRetryInterval(globalLockAnno.lockRetryInterval()); config.setLockRetryTimes(globalLockAnno.lockRetryTimes()); return config; } }); }

4） io.seata.rm.GlobalLockTemplate#execute的核心逻辑是根据上下文情况获取当前全局锁的配置，在执行业务逻辑方法之前，在ThreadLocal中打上需要全局行锁判断的标记，后续逻辑会读取这个标记。在业务逻辑方法执行之后，也需要将标记从当前ThreadLocal中移除。

java

复制代码

public class GlobalLockTemplate { //先判断当前是否已经在globalLock范围之内，如果已经在范围之内，那么把上层的配置取出来，用新的配置替换， // 在方法执行完毕时候，释放锁，或者将配置替换成之前的上层配置 public Object execute(GlobalLockExecutor executor) throws Throwable { boolean alreadyInGlobalLock = RootContext.requireGlobalLock(); if (!alreadyInGlobalLock) { //如果开启全局锁，会在threadLocal 放置一个标记 CONTEXT_HOLDER.put(KEY_GLOBAL_LOCK_FLAG, VALUE_GLOBAL_LOCK_FLAG); RootContext.bindGlobalLockFlag(); } // set my config to config holder so that it can be access in further execution // for example, LockRetryController can access it with config holder // 在上下文中保存旧GlobalLock的配置，使用当前GlobalLock的配置 GlobalLockConfig myConfig = executor.getGlobalLockConfig(); GlobalLockConfig previousConfig = GlobalLockConfigHolder.setAndReturnPrevious(myConfig); try { return executor.execute(); } finally { // only unbind when this is the root caller. // otherwise, the outer caller would lose global lock flag if (!alreadyInGlobalLock) { RootContext.unbindGlobalLockFlag(); } // if previous config is not null, we need to set it back // so that the outer logic can still use their config if (previousConfig != null) { // 恢复旧Globallock的配置 GlobalLockConfigHolder.setAndReturnPrevious(previousConfig); } else { // 业务逻辑执行后，上下文中移除当前Globallock的配置 GlobalLockConfigHolder.remove(); } } } }

5）接下来处理业务方法时，对于 Seata AT 模式来说，其关注点在于 SQL 的执行环节，因为 AT 模式是代理数据源后做增强，即在处理 SQL 的环节做增强，对 CRUD 操作，提供了多种 xxxExecutor，如DeleteExecutor、UpdateExecutor，Seata 在这些 xxxExecutor 的基类方法BaseTransactionalExecutor#execute方法内从ThreadLocal中获取需要全局锁的标记，传递给ConnectionProxy，当然如果有标记才做全局行锁的判断处理

scss

复制代码

@Override public T execute(Object... args) throws Throwable { String xid = RootContext.getXID(); if (xid != null) { statementProxy.getConnectionProxy().bind(xid); } // 从上下文中获取是否需要全局锁的标记，传递给ConnectionProxy statementProxy.getConnectionProxy().setGlobalLockRequire(RootContext.requireGlobalLock()); // 处理sql return doExecute(args); }

6）在上一步提到的 xxxExecutor 有好几种，处理不同类型的 SQL 的逻辑也比较复杂，对全局锁的判断这种逻辑属于公共逻辑，所以Seata的设计是统一在本地事务执行commit的前一步（前后镜像构建之后）才做全局事务锁的处理(这样可以减少持锁时间)，即ConnectionProxy#commit内的doCommit中，其内部因上下文不同有两种后续分支，一种是全局事务提交，一种是 globallock+本地事务提交。

scss

复制代码

private void doCommit() throws SQLException { if (context.inGlobalTransaction()) { // 处理全局事务 processGlobalTransactionCommit(); } else if (context.isGlobalLockRequire()) { //申请到全局锁后执行本地提交 processLocalCommitWithGlobalLocks(); } else { targetConnection.commit(); } }

7） globallock+本地事务提交这种情况的处理在代码processLocalCommitWithGlobalLocks()中，其中的逻辑是用ConnectionProxy#checkLock判断有冲突的全局行锁是否存在（本事务所操作的行记录构造成行锁记录是否跟在 TC 侧已存在的全局行锁记录有重复），不存在的情况下通过targetConnection.commit()提交本地事务；这个过程中并不会并不会并不会在 TC 中添加全局行锁记录。

scss

复制代码

private void processLocalCommitWithGlobalLocks() throws SQLException { // 询问TC是否有锁冲突，若有会抛出异常，不执行下边的commit(); checkLock(context.buildLockKeys()); try { targetConnection.commit(); } catch (Throwable ex) { throw new SQLException(ex); } context.reset(); }

8）如果ConnectionProxy#checkLock检测到全局行锁记录已存在的话，会抛出LockConflictException

scss

复制代码

public void checkLock(String lockKeys) throws SQLException { if (StringUtils.isBlank(lockKeys)) { return; } // Just check lock without requiring lock by now. try { // 请TC发送RPC请求，查询 lockKeys 在TC侧是否已存在 boolean lockable = DefaultResourceManager.get().lockQuery(BranchType.AT, getDataSourceProxy().getResourceId(), context.getXid(), lockKeys); if (!lockable) { // lockKeys 已在TC侧所在的话，则是锁冲突，抛出LockConflictException异常 // ConnectionProxy.LockRetryPolicy.doRetryOnLockConflict()捕获此异常做重试管理 throw new LockConflictException(String.format("get lock failed, lockKey: %s",lockKeys)); } } catch (TransactionException e) { //lockQuery()中并未抛出异常，谁来抛出 TransactionException 呢？ recognizeLockKeyConflictException(e, lockKeys); } }

这里有个疑问，AT 模式下才有lockQuery动作，在 TC 端对lockQuery的具体实现在AbstractLockManager#isLockable()中，但其中并没有抛出异常，所以上边的recognizeLockKeyConflictException什么情况使用呢？

arduino

复制代码

public boolean isLockable(String xid, String resourceId, String lockKey) throws TransactionException { if (StringUtils.isBlank(lockKey)) { // no lock return true; } List<RowLock> locks = collectRowLocks(lockKey, resourceId, xid); try { return getLocker().isLockable(locks); } catch (Exception t) { LOGGER.error("isLockable error, xid:{} resourceId:{}, lockKey:{}", xid, resourceId, lockKey, t); return false; } }

9）方法外部捕获这个异常后重试，源码中试试有两处试试重试策略，一种是 AbstractDMLBaseExecutor#executeAutoCommitTrue内，另一种是在在ConnectionProxy#commit中；两者根据上下文条件不同只有一处生效，简单来理解：

如果服务调用被 Spring 事务包括，那么 Spring 事务会将AutoCommit设置的 false，那么重试逻辑发生在ConnectionProxy#commit中
如果服务调用没有被 Spring 事务包括，那么通常来说AutoCommit的值就是 true，那么重试逻辑发生在AbstractDMLBaseExecutor#executeAutoCommitTrue中

对于第一种情况来说ConnectionProxy#commit中的ConnectionProxy#doCommit外层的重试管理逻辑lockRetryPolicy.execute(() -> {doCommit();...})

java

复制代码

@Override public void commit() throws SQLException { ... // 重试管控 lockRetryPolicy.execute(() -> { // doCommit()方法传递给 doRetryOnLockConflict doCommit(); return null; }); ... }

上述方法本质是将doCommit()方法传递给方法 doRetryOnLockConflict，其内部通过循环+sleep 的方式完成重试。除了重试管控的逻辑，尤其需要注意，在冲突的情况下，onException方法中会有回滚操作，当重试执行

scss

复制代码

protected <T> T doRetryOnLockConflict(Callable<T> callable) throws Exception { LockRetryController lockRetryController = new LockRetryController(); // 循环 while (true) { try { return callable.call(); } catch (LockConflictException lockConflict) { // 冲突的情况下，执行本地rollback(); onException(lockConflict); // AbstractDMLBaseExecutor#executeAutoCommitTrue the local lock is released if (connection.getContext().isAutoCommitChanged() && lockConflict.getCode() == TransactionExceptionCode.LockKeyConflictFailFast) { lockConflict.setCode(TransactionExceptionCode.LockKeyConflict); } // sleep方法里重试和控制间隔； // 超过次数抛出异常，退出循环 lockRetryController.sleep(lockConflict); } catch (Exception e) { onException(e); throw e; } } }

在 LockRetryController#sleep方法中控制重试次数(内部变量--) 和重试间隔（普通的 sleep(xxx))，超过次数抛出异常，退出循环。

java

复制代码

public void sleep(Exception e) throws LockWaitTimeoutException { // prioritize the rollback of other transactions // 重试次数控制 if (--lockRetryTimes < 0 || (e instanceof LockConflictException && ((LockConflictException)e).getCode() == TransactionExceptionCode.LockKeyConflictFailFast)) { throw new LockWaitTimeoutException("Global lock wait timeout", e); } try { // 通过sleep控制重试间隔 Thread.sleep(lockRetryInterval); } catch (InterruptedException ignore) { } }

另外一种情况，即服务调用没有被 Spring 事务包括，那么通常来说AutoCommit的值就是 true，那么重试逻辑发生在AbstractDMLBaseExecutor#executeAutoCommitTrue中，虽然内部也会调用ConnectionProxy#commit，但ConnectionProxy#commit内的重试逻辑不会被执行。另外区别之处在于重试内的逻辑还多了业务 sql 的执行以及前后镜像的构建，即下方注释中的 2.1 环节，但 GlobalLocks 这种场景下，真的还需要构造前后镜像嘛？

java

复制代码

/* 前提 :如果有Spring事务开启，将AutoCommit设置的false，则不执行这个方法功能概述： 1. 执行此方法时， Seata 框架将AutoCommit设置的false，目的是 2.1 和 2.2 两个步骤中的所有本地sql同时提交，简单理解就是业务sql 和 Seata框架的undo_log一起提交。 2. 提交过程可能遇到锁冲突，在遇到锁冲突时，会有重试策略，重试逻辑中有2个逻辑主体： 2.1 .业务sql的执行(构造前后镜像） 2.2 .commit(此时，其内部的重试策略无效),下述逻辑根据上下文是三选一 2.2.1 processGlobalTransactionCommit(); 执行分支事务的提交，向TC申请行锁，锁冲突则进入重试逻辑不冲突执行注册分支事务，提交本地事务，向TC上报结果 2.2.2 processLocalCommitWithGlobalLocks(); 申请到全局锁后执行本地提交，这种情况下还需要构造前后镜像嘛？ 2.2.3 targetConnection.commit(); 直接提交本地事务 */ protected T executeAutoCommitTrue(Object[] args) throws Throwable { ConnectionProxy connectionProxy = statementProxy.getConnectionProxy(); try { connectionProxy.changeAutoCommit(); return new LockRetryPolicy(connectionProxy).execute(() -> { T result = executeAutoCommitFalse(args); connectionProxy.commit(); return result; }); } catch (Exception e) { // when exception occur in finally,this exception will lost, so just print it here LOGGER.error("execute executeAutoCommitTrue error:{}", e.getMessage(), e); if (!LockRetryPolicy.isLockRetryPolicyBranchRollbackOnConflict()) { connectionProxy.getTargetConnection().rollback(); } throw e; } finally { connectionProxy.getContext().reset(); connectionProxy.setAutoCommit(true); } }

四、最后说一句

我是石页兄，如果这篇文章对您有帮助，或者有所启发的话，欢迎关注笔者的微信公众号【架构染色】进行交流和学习。您的支持是我坚持写作最大的动力。