写在前面
贾克斯一直让我们去看下Apache Doris
的相关概念,我却一直没放在心上,首先当然是我随便百度了下发现没啥好文章,其次是我总在以自己要去忙其他事为借口。所以最终要设计的时候我出不上力了,因为我连基础概念都不懂!
get到的一点是直接去官网上看其文档就可以学习了啊!贾克斯就是这么做的。
官网地址: Apache Doris
数据模型
与MySQL一样,以表(Table)的形式(逻辑上的描述),一张表也包括了行(Row)和列(Column)。
Row即一行数据,Column用于描述一行数据中不同的字段。
Column分为两大类:Key
和 Value
。
- key列全局有序
- 全key全局唯一
- 相同key的行,其Value列合并(SUM
- 所以从业务角度上来说,把key列叫做维度列(报表划分),value列则叫做指标列(报表展示)。
Doris
的数据模型主要分为3类:
- Aggregate
AggregationType
目前有以下四种聚合方式:- SUM
- REPLACE:替代,下一批数据中的 Value 会替换之前导入过的行中的 Value。
- MAX:保留最大值。
- MIN:保留最小值
- Uniq
- Duplicate
列的数据类型有:
- bitmap
聚合函数有以下:
- BITMAP_UNION
What Is The Bitmap Data Type?
参考文档
数据模型、ROLLUP 及前缀索引