Doris进阶——分区与分桶

小眼睛的Ayuan

已于 2022-06-16 16:52:35 修改

阅读量5k

点赞数 1

分类专栏： Doris 笔记文章标签： less sql 前端

于 2022-06-16 16:52:17 首次发布

本文链接：https://blog.csdn.net/weixin_59812175/article/details/125311484

版权

本文深入探讨了Doris中的分区与分桶概念。Partition包括Range和List分区，支持根据指定范围或枚举值进行数据划分。Bucket基于Hash，用于进一步细化数据分布。复合分区结合了分区与分桶，适用于处理历史数据清理和解决数据倾斜问题。通过调整分桶数量和选择合适的分桶列，可以优化查询性能和数据分布。

摘要由CSDN通过智能技术生成

分区与分桶：

Doris中有两层的数据划分，第一层是分区（Partition），第二层是分桶（Bucket）。

Partition又能分为Range分区和List分区。Bucket仅支持Hash方式。

Partition：

只能指定Key列作为分区列
指定分区值时需要加双引号
理论上分区数量没有上限
在不使用分区建表时，系统会自动创建一个表名一致但是用户不可见的全表分区

Partition_Range：

按照指定范围进行分区，一般生产环境下会使用日期作为分区

VALUES LESS THAN (...) ：仅指定上界，系统会将前一个分区的上界作为该分区的下界，会生成一个左闭右开的区间
VALUES [....) ：同时指定上下界，比较好理解，也会生成一个左闭右开的区间
查看Partition的使用命令：HELP　PARTITION；

示例：

-- 创建一张Range分区表

CREATE TABLE IF NOT EXISTS test.students2
(
    `sid` LARGEINT NOT NULL COMMENT "学生id",
    `name` VARCHAR(50

最低0.47元/天解锁文章

小眼睛的Ayuan

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
0
评论
Doris进阶——分区与分桶

Doris分区和分桶
复制链接

扫一扫

专栏目录