深入剖析ShardingSphere:探索其内核原理与核心源码,揭秘分库分表技术的奥秘

一、 内核剖析

ShardingSphere虽然有多个产品,但是他们的数据分片主要流程是完全一致的。

解析引擎

        解析过程分为词法解析和语法解析。 词法解析器用于将SQL 拆解为不可再分的原

子符号,称为Token  并根据不同数据库方言所提供的字典,将其归类为关键字,

表达式,字面量和操作符。 再使用语法解析器将SQL转换为抽象语法树(简称AST,

Abstract  Syntax  Tree)

例如对下面一条SQL 语句:

 SELECT id,name FROM t_user WHERE status ='ACTIVE' AND age >18

会被解析成下面这样一颗树:

为了便于理解,抽象语法树中的关键字的 Token 用绿色表示,变量的 Token 用红色表示,灰色表示需要进一步拆分。通过对抽象语法树的遍历,可以标记出所有可能需要改写的位置。

SQL 的一次解析过程是不可逆的,所有tokenSQL 原本的顺序依次进行解析,性能 很高。并且在解析过程中,需要考虑各种数据库SQL方言的异同,提供不同的解析模版。

其中,SQL 解析是整个分库分表产品的核心,其性能和兼容性是最重要的衡量指标。ShardingSphere 在1.4x之前采用的是性能较快的Druid 作为SQL解析器。1.5.x  版本后,采用自研的SQL 解析器,针对分库分表场景,采取对SQL半理解的方式,提 SQL 解析的性能和兼容性。然后从3.0.x版本后,开始使用ANLTR 作为SQL 解析引  擎。这是个开源的SQL 解析引擎,ShardingSphere 在使用ANLTR 时,还增加了一些AST 的缓存功能。针对ANLTR4 的特性,官网建议尽量采用PreparedStatement 预编译方式来提高SQL 执行的性能。

sql 解析整体结构:

路由引擎

根据解析上下文匹配数据库和表的分片策略,生成路由路径。

ShardingSphere 的分片策略主要分为单片路由(分片键的操作符是等号)、多片路由 (分片键的操作符是IN)和范围路由(分片键的操作符是Between)。 不携带分片键的SQL   则是广播路由。

分片策略通常可以由数据库内置也可以由用户方配置。内置的分片策略大致可分为 尾数取模、哈希、范围、标签、时间等。 由用户方配置的分片策略则更加灵活,可以根据使用方需求定制复合分片策略。

实际使用时,应尽量使用分片路由,明确路由策略。因为广播路由影响过大,不利于集群管理及扩展。

改写引擎

用户只需要面向逻辑库和逻辑表来写SQL,   ShardigSphere 的改写引擎将SQL 改写为在真实数据库中可以正确执行的语句。 SQL 改写分为正确性改写和优化改写。

执行引擎

ShardingSphere 并不是简单的将改写完的SQL 提交到数据库执行。执行引擎的目标是自动化的平衡资源控制和执行效率。

例如他的连接模式分为内存限制模式(MEMORY_STRICTLY)    和连接限制模式(CONNECTION_STRICTLY)。      内存限制模式只关注一个数据库连接的处理数量,通 常一张真实表一个数据库连接。而连接限制模式则只关注数据库连接的数量,较大的查询会进行串行操作。

归并引擎

将从各个数据节点获取的多数据结果集,组合成为一个结果集并正确的返回至请求

客户端,称为结果归并。

其中,流式归并是指以一条一条数据的方式进行归并,而内存归并是将所有结果集

都查询到内存中,进行统一归并。

二、ShardingSphereSPI扩展 

ShardingSphere为了兼容更多的应用场景,在源码中保留了大量的SPI扩展点。所

以在看源码之前,需要对JAVASPI机制有足够的了解。

1、 SPI机制

SPI的全名为:Service Provider Interface。在java.util.ServiceLoader的文档里有 比较详细的介绍。

简单的总结下 Java SPI 机制的思想。我们系统里抽象的各个模块,往往有很多不同  的实现方案,比如日志模块的方案,xml解析模块、jdbc模块的方案等。面向的对象 的设计里,我们一般推荐模块之间基于接口编程,模块之间不对实现类进行硬编码。

一旦代码里涉及具体的实现类,就违反了可拔插的原则,如果需要替换一种实现, 就需要修改代码。为了实现在模块装配的时候能不在程序里动态指明,这就需要一种服务发现机制。

Java SPI 就是提供这样的一个机制:为某个接口寻找服务实现的机制。有点类似IOC的思想,就是将装配的控制权移到程序之外,在模块化设计中这个机制尤其重要

Java SPI 的具体约定为:当服务的提供者,提供了服务接口的一种实现之后,在jar包 的META-INF/services/目录里同时创建一个以服务接口命名的文件。该文件里就是实现该服务接口的具体实现类。

而当外部程序装配这个模块的时候,就能通过该jar包META-INF/services/里的配置 文件找到具体的实现类名,并装载实例化,完成模块的注入。

基于这样一个约定就能很好的找到服务接口的实现类,而不需要再代码里制定。jdk 提供服务实现查找的一个工具类:java.util.ServiceLoader。

2、 ShardingSphere中的SPI扩展点

ShardingSphere的开发思想是对源码中主体流程封闭,而对SPI开放。在配套的官方文档《shardingsphere_docs_cn.pdf》的开发者手册部分详细列出了 ShardingSphere的所有SPI扩展点。

3、实现自定义主键生成策略

使用ShardingSphere提供的SPI扩展点,实现自定义分布式主键生成策略。参见示 例代码。

  • 24
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

光芒软件工匠

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值