目录
进入正文之前,欢迎订阅专题、对博文点赞、评论、收藏,关注IT贫道,获取高质量博客内容!
Doris 支持两层的数据划分:
第一层是 Partition,即分区。用户可以指定某一维度列作为分区列(Ranger分区当前只支持整型和时间类型的列),并指定每个分区的取值范围,分区支持 Range 和 List 的划分方式。
第二层是 Bucket分桶(Tablet),仅支持 Hash 的划分方式,用户可以指定一个或多个维度列以及桶数对数据进行 HASH 分布或者不指定分桶列设置成 Random Distribution对数据进行随机分布。
创建Doris表时也可以仅使用一层分区,使用一层分区时,只支持Bucket分桶划分,这种表叫做单分区表;如果一张表既有分区又有分桶,这张表叫