你可能忽视的 MyBatis 3.5.X 在 JDK8 中存在的性能问题

>>号外:关注“Java精选”公众号,回复“2021面试题”关键词,领取全套500多份Java面试题文件。

最近,有客户使用TiDB适配批处理场景,处理性能和预期相差很多。在相同数据量的情况下,Oracle耗时15分钟,TiDB耗时35分钟。这让我们感到困惑,因为从经验上看,在批处理场景下,TiDB的性能是好过Oracle的。

远程排查

通过grafana发现程序运行时集群的资源使用率非常低,判断应用发来的压力较小。将应用并发数40提高到100,资源使用率和QPS指标几乎没有变化。通过connection count监控看到,随着并发数的增加,连接数也同样增加了,确认并发数修改是生效的。但执行show processlist发现大部分连接是空闲状态。简单走查了下应用程序代码,是Spring batch + MyBatis结构。因为Spring batch设置并发的方式很傻瓜,考虑调整线程数应该是生效且可以正常工作的。

虽然还没有搞清资源使用率低的问题,但还是有其他收获,ping应用和TiDB集群的网络延迟,达到了2~3ms。为了排除高网络延迟的干扰,将应用部署到TiDB集群内部运行,批处理耗时从35分钟下降到27分钟,但依然和oracle有较大差距。因为数据库本身没有压力,所以当时的情况调整数据库参数也没什么意义。

因为应用提高并发的效果不符合预期,所以考虑线程可能造成了阻塞,但也没有证据,于是想了这样的场景来简单验证到底是应用的问题还是数据库的问题:在TiDB集群中创建两个完全相同的databased1 和 d2,使用两个完全相同的批处理应用分别对 d1d2 中的数据进行处理,等同于双倍压力写入TiDB集群,预期结果是对于双倍的数据量,同样可以在27分钟处理完,同时数据库资源使用率应大于一个应用的。测试结果符合预期,证明应用提高并发没有效果

客户反馈给我们可能的几种情况:

  1. 应用并发太高,CPU繁忙导致应用性能瓶颈。

    应用服务器的 CPU 消耗只有 6%,不应该存在性能瓶颈。

  2. Spring batch 内部有一些元数据表,同时更新元数据表的同一条数据会造成阻塞。

    这种情况应该是阻塞在数据库造成锁等待或锁超时,不应该阻塞在应用端。

客户的解决思路:

  1. 多应用部署并发运行,性能随应用部署数线性提升。

    不能解决单机应用性能瓶颈问题,对于业务高峰时的拓展也很不方便。

  2. 采用异步处理的方案,提高应用吞吐。

    目前是有些异步访问数据库的技术,但成熟度低,强烈不建议使用。

现场排查

  • 现场使用JDBC编写了Demo对集群进行压测,发现数据库资源使用率随着并发数提高而增长,证明提高并发数可以给数据库制造更高的压力,此时完全排除数据库问题的可能。

  • 通过VisualVM发现,应用程序的大量线程处于BLOCK状态,这种情况线程开的多其实也没用上,实锤性能瓶颈来自应用。

  • 走查应用代码,发现虽然有用到同步锁等逻辑,但应该不会造成严重的线程阻塞。

    通过dump发现线程都阻塞在了MyBatis的堆栈中,

Locked ownable synchronizers:
    - <0x000000008523ca00> (a java.util.concurrent.ThreadPoolExecutor$worker)

"taskExecutorForHb-197" #342 prio=5 os_prio=0 tid=0x0007f5d7c72f800 nid=0x182c waiting for monitor entry [0x00007f5ccd6d4000]
    java.lang.thread.State: BLOCKED (on  object monitor)
    - waiting to lock <0x0000000080a772d8> (a java.util.concurrent.ConcurrentHashMap$Node)
    at org.apache.ibatis.reflection.DefaultReflection.DefaultReflectorFactory.fineForClass(DefaultReflectorFactory.java:1674)

是在MyBatis源码中的这个位置,DefaultReflectorFactory.java

https://github.com/mybatis3/mybatis-3/blob/master/src/main/java/org/apache/ibatis/reflection/DefaultReflectorFactory.java#L42

public Reflector findForClass(Class<?> type) {
    if (classCacheEnabled) {
        // synchronized (type) removed see issue #461
        return reflectorMap.computeIfAbsent(type, Reflector::new);
    } else {
        return new Reflector(type);
    }
}

这里大致是这样,MyBatis在进行参数处理、结果映射等操作时,会涉及大量的反射操作。Java中的反射虽然功能强大,但是代码编写起来比较复杂且容易出错,为了简化反射操作的相关代码,MyBatis 提供了专门的反射模块,它对常见的反射操作做了进一步封装,提供了更加简洁方便的反射 API 。DefaultReflectorFactory提供的findForClass()会为指定的Class创建Reflector对象,并将Reflector对象缓存到reflectorMap中,造成线程BLOCK的就在对reflectorMap的操作上。因为MyBatis支持对ReflectorFactory自定义实现,所以当时的思路是绕过缓存的步骤,也就是将classCacheEnabled设为false,走return new Reflector(type)的逻辑。但依然会在其他调用ConcurrentHashmap.computeIfAbsent的地方被阻塞。

到这看起来是一个通用问题,于是将注意力放到concurrentHashmapcomputerIfAbsent上。computerIfAbsent是 JDK8 中为map提供的新方法,

public V computeIfAbsent(K key, Function<? super K,? extends V> mappingFunction)

它首先判断缓存map中是否存在指定key的值,如果不存在,会自动调用mappingFunction (key)计算keyvalue,然后将key = value放入到缓存mapConcurrentHashMap重写了computeIfAbsent方法确保mappingFunction中的操作是线程安全的。

该方法在官方说明中一段:

The entire method invocation is performed atomically, so the function is applied at most once per key. Some attempted update operations on this map by other threads may be blocked while computation is in progress, so the computation should be short and simple, and must not attempt to update any other mappings of this map.

可以看到,为了保证原子性,当对相同key进行修改时,可能造成线程阻塞。显而易见这会造成比较严重的性能问题,在 Java 官方 Jira,也有用户提到了同样的问题。

JDK-8161372

https://bugs.openjdk.java.net/browse/JDK-8161372?focusedCommentId=14260334&page=com.atlassian.jira.plugin.system.issuetabpanels%3Acomment-tabpanel#comment-14260334

很多开发者都以为computeIfAbsent是不会造成线程 block 的,但事实却是相反的。而 Java 官方当时认为这个方法的设计没问题。但反思之后也觉得,在性能还不错的 concurrenthashmap 中有这么个拉胯兄弟确实不太合适。所以,官方在 JDK9 中修复了这个问题。

验证

将现场 JDK 版本升级到 9 ,应用在 500 并发,并排除网络延迟干扰的情况下,批处理耗时 16分钟 。应用服务器 CPU 达到 85% 左右使用率,出现性能瓶颈。理论上,提高应用服务器配置、优化数据库参数都可以进一步提升性能。

当时的结论

MyBatis 3.5.X 在缓存反射对象用到的computerIfAbsent方法在 JDK8 中性能不理想。需要升级 JDK9 及以上版本解决这个问题。对于 MyBatis 本身,没有针对 JDK8 中的computerIfAbsent性能问题进行特殊处理,所以升级 MyBatis 版本也不能解决问题。

但可以降级(斜眼笑,在 MyBatis 3.4.X 中,还没有引入这个函数,所以理论上可以规避这个问题。

@Override
public Reflector findForClass(Class<?> type) {
   if (classCacheEnabled) {
           // synchronized (type) removed see issue #461
     Reflector cached = reflectorMap.get(type);
     if (cached == null) {
       cached = new Reflector(type);
       reflectorMap.put(type, cached);
     }
     return cached;
   } else {
     return new Reflector(type);
   }
 }

现在的结论

MyBatis 官方在收到我们的反馈后,非常效率地修复了这个问题。手动点赞????

可以看到 MyBatis 官方对computerIfAbsent进行了一层封装,如果value已存在,则直接return,这样操作相同key的线程阻塞问题就被绕过去了。会在3.5.7版本中合入这个PR

public class MapUtil {
  /**
   * A temporary workaround for Java 8 specific performance issue JDK-8161372 .<br>
   * This class should be removed once we drop Java 8 support.
   *
   * @see <a href="https://bugs.openjdk.java.net/browse/JDK-8161372">https://bugs.openjdk.java.net/browse/JDK-8161372</a>
   */
  public static <K, V> V computeIfAbsent(Map<K, V> map, K key, Function<K, V> mappingFunction) {
    V value = map.get(key);
    if (value != null) {
      return value;
    }
    return map.computeIfAbsent(key, mappingFunction::apply);
  }

  private MapUtil() {
    super();
  }
}

作者:sev7n

juejin.cn/post/6950174748567568392

往期精选  点击标题可跳转

复盘 Spring boot 中定时任务如何启用异步线程池

Spring Boot 框架中使用自定义注解 + 拦截器实现身份证等敏感数据加解密

Java 中处理 Exception 的 9 种实践,曾被很多团队认可采纳,值得收藏!

Java 中 ThreadPoolExecutor 线程池必备知识点:工作流程、常见参数、性能调优及监控

Java 中统计代码执行耗时,列举 4 种优雅的解决方案

MySQL 分页使用 limit 和 offset 参数为什么会导致执行变慢?

全网可能是最全的 JAVA 日志框架适配、冲突解决方案

数据库在哪些场景下导致索引失效,索引何时会失效?

为什么 Redis 越来越慢了?延迟问题定位排查与分析

Spring 框架中导致 @Transactional 事务注解 3 种失效场景分析及解决方法

放弃 JDK8 中 StringBuilder,使用 StringJoiner 辅助类,真香!

点个赞,就知道你“在看”!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值