Doris---数据表设计

本文详细介绍了 Doris 中数据表的设计,包括 Row & Column 的概念,以及 Partition 和 Bucket 的原理与实践。Partition 分为 Range 和 List 两种类型,影响数据的逻辑组织。Bucket 则关注数据在物理上的分布,影响查询效率和并发性能。合理选择分区和分桶策略对于数据管理和查询性能至关重要。
摘要由CSDN通过智能技术生成

表的基本概念

1 Row & Column

一张表包括行(Row)和列(Column);

Row 即用户的一行数据。Column 用于描述一行数据中不同的字段。

doris中的列分为两类:key列和value列

key列在doris中有两种作用:

聚合表模型中,key是聚合和排序的依据

其他表模型中,key是排序依据

 2 分区与分桶

  • partition(分区):是在逻辑上将一张表按行(横向)划分

  • tablet(又叫bucket,分桶):在物理上对一个分区再按行(横向)划分

 

 2.1 Partition

  • Partition 列可以指定一列或多列,在聚合模型中,分区列必须为 KEY 列。

  • 不论分区列是什么类型,在写分区值时,都需要加双引号。

  • 分区数量理论上没有上限。

  • 当不使用 Partition 建表时,系统会自动生成一个和表名同名的,全值范围的 Partition。该 Partition 对用户不可见,并且不可删改。

  • 创建分区时不可添加范围重叠的分区。

 1)Range 分区

range分区创建语法

-- Range Partition
drop table if exists test.expamle_range_tbl;
CREATE TABLE IF NOT EXISTS test.expamle_range_tbl
(
    `user_id` LARGEINT NOT NULL COMMENT
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值