下一代实时数据库：Apache Doris 【五】数据表的创建_doris 新建数据库

2401_84181536

于 2024-05-03 21:45:03 发布

阅读量697

点赞数 20

分类专栏：程序员文章标签：数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84181536/article/details/138425457

版权

在 Doris 中，数据都以关系表（Table）的形式进行逻辑上的描述。

3.2.1 Row & Column

一张表包括行（Row）和列（Column）。Row 即用户的一行数据。Column 用于描述一

行数据中不同的字段。

⚫ 在默认的数据模型中，Column 只分为排序列和非排序列。存储引擎会按照排序列

对数据进行排序存储，并建立稀疏索引，以便在排序数据上进行快速查找。

⚫ 而在聚合模型中，Column 可以分为两大类：Key 和 Value。从业务角度看，Key 和

Value 可以分别对应维度列和指标列。从聚合模型的角度来说，Key 列相同的行，

会聚合成一行。其中 Value 列的聚合方式由用户在建表时指定。

3.2.2 Partition & Tablet

在 Doris 的存储引擎中，用户数据首先被划分成若干个分区（Partition），划分的规则通

常是按照用户指定的分区列进行范围划分，比如按时间划分。而在每个分区内，数据被进一

步的按照 Hash 的方式分桶，分桶的规则是要找用户指定的分桶列的值进行 Hash 后分桶。

每个分桶就是一个数据分片（Tablet），也是数据划分的最小逻辑单元。

⚫ Tablet 之间的数据是没有交集的，独立存储的。Tablet 也是数据移动、复制等操作

的最小物理存储单元。

⚫ Partition 可以视为是逻辑上最小的管理单元。数据的导入与删除，都可以或仅能针

对一个 Partition

最低0.47元/天解锁文章

关注

20
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
下一代实时数据库：Apache Doris 【五】数据表的创建_doris 新建数据库

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。在 Doris 的存储引擎中，用户数据首先被划分成若干个分区（Partition），划分的规则通。Row 即用户的一行数据。步的按照 Hash 的方式分桶，分桶的规则是要找用户指定的分桶列的值进行 Hash 后分桶。⚫ Tablet 之间的数据是没有交集的，独立存储的。注：聚合模型在定义字段类型后，可以指定字段的 agg_type 聚合类型，如果不指定，从聚合模型的角度来说，Key 列相同的行，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。