doris或者startRocks的建表规范

mr_wuyongfu

已于 2024-02-26 17:48:59 修改

阅读量444

点赞数 7

文章标签：数据库

于 2024-02-26 17:14:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41673645/article/details/136304351

版权

本文介绍了数据库中分区表（包括动态分区和静态分区）、非分区表以及不同建表模型（如聚合、唯一、明细和主键模型）的区别和使用场景，特别关注了RocksDB中的分区参数设置。

摘要由CSDN通过智能技术生成

分区表与非分区表

动态分区表（需加分区分桶字段和动态分区的参数，一般都使用数据的创建时间作为分区字段，此时间之后再也不会发生变化，否则在之后的数据进行更新操作时，相同的数据会落入不同的分区之中，造成数据重复问题。动态分区表的动态主要体现在分区的创建是动态的，无需手动创建）

静态分区表（需加分区分桶字段，但不需要加动态分区参数，一般都使用数据的创建时间作为分区字段，此时间之后再也不会发生变化，否则在之后的数据进行更新操作时，相同的数据会落入不同的分区之中，造成数据重复问题。静态分区表的静态主要体现在分区的创建是需要手动创建的）

非分区表（无需加分区字段，但需加分桶字段，否则报错）

建表模型

聚合模型(aggregate key，需要将非key列的维度字段加replace，如下图的蓝色框所示，指标字段加具体的聚合方式sum,max,min等等，如下图的紫色框所示。此模型会将相同key的指标值进行聚合操作。)

唯一模型（unique key,采用merge on read策略，不会真正的删除数据，而是先将相同key的数据合并为一组，然后返回一组中的最新数据。此模型只显示相同key的最新数据，从而实现去重的效果。）

明细模型(duplicate key，来什么数据就插入什么数据，不会进行去重，也不会进行聚合等等操作)

startRocks比doris多出一种主键模型（delete+insert，真正会删除相同key的历史数据，然后将最新数据进行插入。此模型只存储相同key的最新数据，从而实现去重的效果。）

分区表中的分区参数指定

参数解释：dynamic_partition.start表示以今天为时间基准，创建且保留多少天的历史分区数，为负数。

dynamic_partition.end表示以今天为时间基准，创建且保留多少天的未来分区数，为正数。

因此上图的总分区就是90+60=150个分区

关注

7
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
doris或者startRocks的建表规范

表示以今天为时间基准，创建且保留多少天的历史分区数，为负数。表示以今天为时间基准，创建且保留多少天的未来分区数，为正数。因此上图的总分区就是90+60=150个分区。
复制链接

扫一扫

mr_wuyongfu CSDN认证博客专家 CSDN认证企业博客

码龄6年

老百姓大药房集团

5: 原创

90万+: 周排名

21万+: 总排名

1340: 访问

: 等级

65: 积分

12: 粉丝

13: 获赞

4: 评论

31: 收藏

私信

关注

热门文章

最新评论

flinksql实时统计mysql数据，写入mysql中以及对应的maven依赖
CSDN-Ada助手: 不知道 MySQL入门技能树是否可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
flinksql去消费kafka的数据，当不使用窗口机制，有数据输出，当使用窗口机制，就没有数据输出，怎么办？
隐语的影法師: 我猜测是不是：如果多个并行度，上游数据可能发送到不同的分区，导致无法统计了，对吗？
flinksql去消费kafka的数据，当不使用窗口机制，有数据输出，当使用窗口机制，就没有数据输出，怎么办？
隐语的影法師: 神仙！！！谢谢您解决了我的大难题！但是您知道是为什么设置并行度为1 就可以了吗？
doris或者startRocks的建表规范
CSDN-Ada助手: 推荐 MySQL入门技能树：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
flinksql去消费kafka的数据，当不使用窗口机制，有数据输出，当使用窗口机制，就没有数据输出，怎么办？
CSDN-Ada助手: 恭喜你写了第三篇博客！你对使用flinksql去消费kafka的数据遇到的问题进行了很好的总结。关于窗口机制导致没有数据输出的问题，我觉得你可以尝试检查窗口的设置和数据的时间特征，可能存在一些细微的问题。另外，你也可以尝试查阅一些相关的文档或者向社区寻求帮助，或许会有一些新的思路。希望你能顺利解决问题，期待你的下一篇博客！加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。