- ShardingSphere简介
Apache ShardingSphere 是⼀套开源的分布式数据库中间件解决⽅案组成的⽣态圈,它由 JDBC、Proxy和 Sidecar(规划中)这 3 款相互独⽴,却⼜能够混合部署配合使⽤的产品组成。它们均提供标准化的数据分⽚、分布式事务和数据库治理功能,可适⽤于如 Java 同构、异构语⾔、云原⽣等各种多样化的应⽤场景大,目前常用的功能点有:
- 数据分片(分库分表、读写分离、分片策略可定制化)
- 分布式事务(标准化事务接口、XA强一致事务、柔性事务)
- 数据库治理(分布式治理、弹性伸缩)
本篇文章主要介绍ShardingSphere中的基本概念
-为什么要引入ShardingSphere
随着业务的发展,数据量剧增,所以很容易出现数据表单表查询瓶颈的出现,如果数据量在百万级别,可以通过加索引、sql调优的方法来突破性能瓶颈,但是当数据量达到千万甚至上亿的时候,这个时候通过加索引的方式来优化性能就有点杯水车薪了。这个时候需要考虑对表进行分表。垂直拆分or水平拆分?
- 垂直拆分
根据业务,对数据进行垂直拆分,如将系统分为订单库,用户库
优点:将数据分布在多个库中,变相提高了数据库的并发,同时相关业务的数据在同一个库中,会使得业务更加清晰
缺点:跨库会导致表于表之间无法join查询,只能通过不同项目之间http调用的方式来查询数据,同样也会带来分布式事务问题。
- 水平拆分
将同一张表的数据,按照特定的分片键规则,将数据打散在不同n张相同的表中
优点:通过分片键进行数据查询的时候,速度能大幅度提升,在数据量大的情况下,分表会大幅增加数据库的并发
-执行流程
ShardingSphere 的 3 个产品的数据分⽚主要流程是完全⼀致的。核⼼由 SQL 解析 => 执⾏器优化 => SQL 路由 => SQL 改写 => SQL 执⾏ => 结果归并的流程组成。
- SQL 解析
分为词法解析和语法解析。先通过词法解析器将 SQL 拆分为⼀个个不可再分的单词。再使⽤语法解析器 对 SQL 进⾏理解,并最终提炼出解析上下⽂。解析上下⽂包括表、选择项、排序项、