Doris 数据分布—Partition

最新推荐文章于 2024-08-07 12:16:45 发布

猫猫姐

最新推荐文章于 2024-08-07 12:16:45 发布

阅读量186

点赞数 1

分类专栏： Doris 文章标签： doris

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84052244/article/details/138219023

版权

Doris 专栏收录该内容

17 篇文章 2 订阅 ¥15.90 ¥99.00

订阅专栏

超级会员免费看

本文详细介绍了Doris的数据分区概念，包括Row & Column、Tablet & Partition，以及各种分区方式如Range（单列、多列、批量）和List分区。讨论了动态分区的灵活性和应用场景，并列举了建表过程中可能遇到的常见问题及解决方法。

摘要由CSDN通过智能技术生成

Doris 数据分布—Partition

本文档主要介绍 Doris 的建表和数据划分，以及建表操作中可能遇到的问题和解决方法。

数据分片（Sharding）是分布式数据库分而治之 (Divide And Conquer) 这一设计思想的体现。过去的单机数据库在大数据量下往往面临存储和 IO 的限制，而分布式数据库则通过数据划分的规则，将数据打散分布至不同的机器或节点上，形成分布式存储，因此突破了单机存储空间和 IO 的瓶颈、使库表数据量可以无限拓展。

数据分片主要有范围分片或哈希分片这两种方式，而在实际数据库的实现中，往往呈现为分区和分桶两种形式。分区一般是按照时间或其他连续值对数据进行划分，在执行查询操作时可以通过分区裁剪过滤不必要的范围扫描，提升执行效率，同时也使得对分区数据的增删改等管理操作更为便捷。而分桶则是按照某个关键字执行哈希运算，将相同哈希值的数据放到一起，这样可以有效定位数据、避免数据倾斜。

在 Doris 中，数据都以表（Table）的形式进行逻辑上的描述。

Row & Column

一张表包括行（Row）和列（Column）：

Row：即用户的一行数据；

了解本专栏

超级会员免费看

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Doris 数据分布—Partition

这里我们只以 AGGREGATE KEY 数据模型为例进行说明。更多数据模型参阅Doris 数据模型列的基本类型，可以通过在 mysql-client 中执行查看。AGGREGATE KEY 数据模型中，所有没有指定聚合方式（SUM、REPLACE、MAX、MIN）的列视为 Key 列。而其余则为 Value 列。Key 列必须在所有 Value 列之前。尽量选择整型类型。因为整型类型的计算和查找效率远高于字符串。对于不同长度的整型类型的选择原则，遵循够用即可。
复制链接

扫一扫

专栏目录

猫猫姐 CSDN认证博客专家 CSDN认证企业博客

码龄162天

242: 原创

1万+: 周排名

8182: 总排名

11万+: 访问

: 等级

4492: 积分

1788: 粉丝

1955: 获赞

9: 评论

1468: 收藏

私信

关注

热门文章

分类专栏

最新评论

数据仓库—ETL工具与技术：数据仓库的坚实基石
Byyyi耀: 感谢分享，学到了很多新东西，期待更多的好文章！想和您互关一下。
数据仓库—ETL工具与技术：数据仓库的坚实基石
Byyyi耀: 感谢分享，学到了很多新东西，期待更多的好文章！想和您互关一下。
数据仓库—大数据建模
Byyyi耀: 大佬互关吗？非常不错的文章，解决了我大问题！赞一个！
数仓建模—表设计规范
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/618591269。
数仓建模—大数据建模
普通网友: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。