Apache Doris (十四) :聚合模型的局限性、模型选择建议及列定义建议

43 篇文章 30 订阅
Apache Doris 的聚合模型(Aggregate)在 count(*) 查询时效率低下,可通过增加 SUM 类型的 count 列来优化。Unique模型适合有唯一主键约束的场景,而Duplicate模型适用于无聚合和唯一性约束的原始数据存储。在数据模型选择时,应根据业务需求考虑预聚合、主键约束和Ad-hoc查询的性能。列定义时,推荐使用整型类型,注意列总字节不超过100KB。
摘要由CSDN通过智能技术生成

目录

1. 聚合模型的局限性

2.数据模型的选择建议

2.1 Aggregate数据模型选择

​​​​​​​​​​​​​​2.2 Unique数据模型选择

​​​​​​​​​​​​​​2.3 Duplicate数据模型选择

​​​​​​​3. 列定义建议


进入正文之前,欢迎订阅专题、对博文点赞、评论、收藏,关注IT贫道,获取高质量博客内容!


1. 聚合模型的局限性

以上Aggregate数据模型和Unique数据模型是聚合模型,Duplicate数据模型不是聚合模型,聚合模型存在一些局限性,这里说的局限性主要体现在select count(*) from table 操作效率和语意正确性两方面,下面我们针对 Aggregate 模型,来介绍下聚合模型的局限性。

在聚合模型中,模型对外展现的,是最终聚合后的数据。也就是说,在Doris内部任何还未聚合的数据(比如说两个不同导入批次的数据),必须通过某种方式,以保证对外展示的一致性。我们举例说明。

假设表结构如下:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

IT贫道

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值