YugabyteDB YSQL 表分区技术详解-CSDN博客

本文链接：https://blog.csdn.net/gitblog_01013/article/details/148440712

YugabyteDB YSQL 表分区技术详解

yugabyte-db yugabyte/yugabyte-db: 是 YugaByte DB 的官方仓库，一个高性能、高可扩展、分布式的 SQL 数据库，支持 PostgreSQL 兼容性。适合对分布式数据库、SQL 数据库和云原生应用的开发者。项目地址: https://gitcode.com/gh_mirrors/yu/yugabyte-db

什么是表分区

表分区是一种将大型表物理分割为多个小型表的技术，在分布式数据库YugabyteDB中，通过YSQL接口可以实现这一功能。分区的主要目的是提高查询性能和管理效率，特别是针对那些包含时间戳列且数据具有明显时间特征的表。

分区表对外表现为一个逻辑整体，应用程序无需感知底层数据的物理分布情况，这使得分区操作对上层应用透明。

分区类型

YSQL支持三种主要的分区策略：

范围分区(RANGE)：基于一个或多个关键列的值范围进行分区，各分区的值范围互不重叠。适用于时间序列数据等具有自然范围特征的数据。
列表分区(LIST)：通过为每个分区显式指定键值列表来进行分区。适用于离散的、可枚举的数据分类。
哈希分区(HASH)：通过指定模数和余数来均匀分布数据。适用于需要均衡负载的场景。

声明式分区实践

创建分区表

以下是一个订单变更记录表的分区示例，我们按照变更日期进行范围分区：

CREATE TABLE order_changes (
  change_date date,
  type text,
  description text
)
PARTITION BY RANGE (change_date);

创建具体分区

为每个月创建一个分区表：

-- 2019年2月分区
CREATE TABLE order_changes_2019_02 PARTITION OF order_changes
  FOR VALUES FROM ('2019-02-01') TO ('2019-03-01');

-- 2019年3月分区  
CREATE TABLE order_changes_2019_03 PARTITION OF order_changes
  FOR VALUES FROM ('2019-03-01') TO ('2019-04-01');

-- 其他月份分区...

分区范围采用左闭右开区间，即包含FROM值但不包含TO值。

默认分区

为处理不符合任何指定分区条件的数据，可以创建默认分区：

CREATE TABLE order_changes_default PARTITION OF order_changes DEFAULT;

索引与分区

在分区表上创建索引时，可以选择两种方式：

在父表上创建索引（自动传播到所有分区）：

CREATE INDEX ON order_changes (change_date);

为每个分区单独创建索引（提供更精细的控制）：

CREATE INDEX ON order_changes_2019_02 (change_date);
CREATE INDEX ON order_changes_2019_03 (change_date);
-- 其他分区索引...

分区维护

动态调整分区

分区表的一个主要优势是可以灵活调整分区结构而无需修改数据：

分离旧分区：

ALTER TABLE order_changes DETACH PARTITION order_changes_2019_03;

添加新分区：

CREATE TABLE order_changes_2021_02 PARTITION OF order_changes
  FOR VALUES FROM ('2021-02-01') TO ('2021-03-01');

分区查询优化

YugabyteDB提供两种查询优化技术来提升分区表查询性能：

分区剪枝(Partition Pruning)：在执行时动态排除不需要扫描的分区。
约束排除(Constraint Exclusion)：在查询规划阶段基于WHERE条件排除不相关的分区。

这两种优化通常默认启用，但在某些特殊场景下可能需要临时禁用：

SET enable_partition_pruning = off;
SET constraint_exclusion = off;
-- 执行需要扫描所有分区的查询
SELECT count(*) FROM order_changes WHERE change_date >= DATE '2019-01-01';