学习分享-数据库中间件ShardingSphere及其绑定表概念

@泡泡糖

已于 2024-06-04 16:27:26 修改

阅读量482

点赞数 5

分类专栏：数据库文章标签：学习数据库中间件

于 2024-06-04 16:16:24 首次发布

本文链接：https://blog.csdn.net/weixin_62079735/article/details/139446319

版权

数据库专栏收录该内容

10 篇文章 0 订阅

订阅专栏

最近在学习的过程中因为分库分表而接触到数据库中间件ShardingSphere及其绑定表，所以在网上查询了它的相关资料做一下分享

什么是ShardingSphere？

ShardingSphere是一款开源的分布式数据库中间件，旨在解决分布式数据库的各种挑战。它为开发者提供了一个透明的分片和读写分离解决方案，支持多种数据库（如MySQL、PostgreSQL、SQL Server等），并且可以无缝地集成到现有的应用程序中。

ShardingSphere包含三个核心组件：

Sharding-JDBC：作为JDBC驱动程序层面的数据库分片和读写分离解决方案，适用于Java应用。
Sharding-Proxy：一个独立的数据库代理层，提供与数据库服务器兼容的协议，适用于各种语言和平台。
Sharding-Sidecar（现已重命名为ShardingSphere-Agent）：面向云原生环境的分片解决方案，适用于Kubernetes等容器编排平台。

通过这些组件，ShardingSphere为用户提供了灵活的分片、读写分离、数据加密、影子库压测等功能。

ShardingSphere的绑定表（Binding Table）

在分布式数据库环境中，联合查询是一个常见的需求。当多个表需要一起进行查询时，如何确保查询的效率和数据的一致性，是一个重要的问题。ShardingSphere通过“绑定表”（Binding Table）机制来解决这个问题。

什么是绑定表

绑定表是指一组具有相同分片键的表，这些表在分片操作时共享相同的分片规则和分片键。在定义绑定表后，ShardingSphere会将这些表视为一个整体进行处理，确保在联合查询时，避免不必要的跨分片数据合并，从而优化查询性能。使用绑定表进行多表关联查询时，必须使用分片键进行关联，否则会出现笛卡尔积关联或跨库关联，从而影响查询效率。例如：t_order 表和 t_order_item 表，均按照 order_id 分片，并且使用 order_id 进行关联，则此两张表互为绑定表关系。绑定表之间的多表关联查询不会出现笛卡尔积关联，关联查询效率将大大提升。举例说明，如果 SQL 为：

SELECT i.* FROM t_order o JOIN t_order_item i ON o.order_id=i.order_id WHERE o.order_id in (10, 11);
在不配置绑定表关系时，假设分片键 order_id 将数值 10 路由至第 0 片，将数值 11 路由至第 1 片，那么路由后的 SQL 应该为 4 条，它们呈现为笛卡尔积：

SELECT i.* FROM t_order_0 o JOIN t_order_item_0 i ON o.order_id=i.order_id WHERE o.order_id in (10, 11);

SELECT i.* FROM t_order_0 o JOIN t_order_item_1 i ON o.order_id=i.order_id WHERE o.order_id in (10, 11);

SELECT i.* FROM t_order_1 o JOIN t_order_item_0 i ON o.order_id=i.order_id WHERE o.order_id in (10, 11);

SELECT i.* FROM t_order_1 o JOIN t_order_item_1 i ON o.order_id=i.order_id WHERE o.order_id in (10, 11);

在配置绑定表关系，并且使用 order_id 进行关联后，路由的 SQL 应该为 2 条：

SELECT i.* FROM t_order_0 o JOIN t_order_item_0 i ON o.order_id=i.order_id WHERE o.order_id in (10, 11);

SELECT i.* FROM t_order_1 o JOIN t_order_item_1 i ON o.order_id=i.order_id WHERE o.order_id in (10, 11);
其中 t_order 表由于指定了分片条件，ShardingSphere 将会以它作为整个绑定表的主表。 所有路由计算将会只使用主表的策略，那么 t_order_item 表的分片计算将会使用 t_order 的条件。

绑定表的优势

优化查询性能：通过绑定表机制，联合查询时可以避免额外的分片键推导和路由计算，从而提高查询效率。
确保数据一致性：绑定表共享相同的分片规则，确保在查询和操作时，数据的一致性和正确性。
简化配置管理：通过定义绑定表，可以简化分片规则的配置和管理，减少出错的可能性。

绑定表的配置示例

绑定表中的多个分片规则，需要按照逻辑表前缀组合分片后缀的方式进行配置
以下是一个简单的配置示例，展示了如何在ShardingSphere中定义绑定表：

shardingRule:
  tables:
    order:
      actualDataNodes: ds_${0..1}.order_${0..1}
      tableStrategy:
        inline:
          shardingColumn: order_id
          algorithmExpression: order_${order_id % 2}
    order_item:
      actualDataNodes: ds_${0..1}.order_item_${0..1}
      tableStrategy:
        inline:
          shardingColumn: order_id
          algorithmExpression: order_item_${order_id % 2}
  bindingTables:
    - order,order_item