Doris三种数据模型Aggregate、Uniq、Duplicate使用

最新推荐文章于 2024-03-29 11:11:51 发布

国林哥

最新推荐文章于 2024-03-29 11:11:51 发布

阅读量563

点赞数

分类专栏： Doris 文章标签：数据库数据仓库 database 大数据运维 linux

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42886699/article/details/132438979

版权

Doris 专栏收录该内容

5 篇文章 1 订阅

订阅专栏

目录

2. 数据模型

2.1 Aggregate数据模型

2.2 uniq数据模型

2.3 Duplicate数据模型

1. key和value

这⾥的key并不是索引的意思，下⾯根据情况具体说明：

Aggregate数据模型：key为聚合的键，value为聚合的值

Uniq数据模型：key为聚合的键，value为聚合的值

Duplicate数据模型：key为建表时指定的duplicate key(sorted column，只是⽤来排序)，其余字段为value

rollup

->作⽤于Aggregate和Uniq数据模型：key为聚合的键，value为聚合的值

->作⽤于Duplicate数据模型：key为rollup命令添加的字段，且添加的字段都是key

2. 数据模型

2.1 Aggregate数据模型

建表语句如下：

根据user_id, date, city, age, sex这5个key进⾏数据的聚合

replace表⽰取最后⼀个insert的数据；但在同⼀个insert中如果包含多条数据，会随机取⼀条

数据聚合分为3个阶段

1. 数据insert时，会对同⼀个insert批次的数据进⾏聚合

2. BE进⾏Compaction时，会对不同insert批次的数据进⾏聚合

3. ⽤户进⾏查询时，在BE后端可能不同insert批次的数据未进⾏聚合，此时会对符合查询条件的数据进⾏内部聚合(不⽤⽤户调⽤group by，会扫描所有列的数据)后，再返回给客户端

所有的key列必须在value列之前.

2.2 uniq数据模型

建表语句如下：

uniq数据模型其实是Aggregate数据模型的⼀种特列

根据user_id, username这2个key进⾏数据的聚合，其余字段按replace⽅式进⾏聚合

2.3 Duplicate数据模型

建表语句如下：

数据不会发⽣内部聚合，插⼊多少条数据，查询就会返回多少条数据

duplicate key只是指定了timestamp和type两个sorted column, ⽤于数据排序，并不能作为数据唯⼀的标识

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
Doris三种数据模型Aggregate、Uniq、Duplicate使用

3. ⽤户进⾏查询时，在BE后端可能不同insert批次的数据未进⾏聚合，此时会对符合查询条件的数据进⾏内部聚合(不⽤⽤户调⽤group by，会扫描所有列的数据)后，再返回给客户端。根据user_id, username这2个key进⾏数据的聚合，其余字段按replace⽅式进⾏聚合。->作⽤于Aggregate和Uniq数据模型：key为聚合的键，value为聚合的值。Aggregate数据模型：key为聚合的键，value为聚合的值。Uniq数据模型：key为聚合的键，value为聚合的值。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

国林哥 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。