在 Doris 中,数据以表(Table)的形式进行逻辑上的描述。一张表包括行(Row)和列(Column)。Row即用户的一行数据。Column 用于描述一行数据中不同的字段。
Column可以分为两大类:Key(维度列)和Value(指标列)
Doris 的数据模型主要分为3类:
- Aggregate
- Uniq
- Duplicate

1.Aggr聚合模型
这是一个典型的用户信息和访问行为的事实表。 在一般星型模型中,用户信息和访问行为一般分别存放在维度表和事实表中。这里我们为了更加方便的解释 Doris 的数据模型,将两部分信息统一存放在一张表中。
表中的列按照是否设置了 AggregationType,分为 Key (维度列) 和 Value
本文详细介绍了Doris的三种数据模型:Aggr(聚合模型)、Uniq(唯一主键模型)和Duplicate(冗余模型)。在Aggr模型中,数据根据Key进行聚合,Value按设定的AggregationType聚合。Uniq模型提供唯一主键约束,适用于留存分析等场景。Duplicate模型则不进行聚合,仅排序,适合日志分析等场景。
订阅专栏 解锁全文
806

被折叠的 条评论
为什么被折叠?



