目录
列式存储
StarRocks由 行 和 列 构成
- 每行 数据对应用户的一条记录
- 每列 数据有相同的数据类型
表的组成
- 纬度列(key列)
- 用于分组和排序
- 指标列(value列)
- 可以通过聚合SUM、COUNT、MIN、MAX、REPLACE、HLL_UNON、BITMAP_UNION等累加起来
表中数据按列存储
- 物理视角
- 一列数据会经过分块编码压缩等操作,然后持久化
- 逻辑视角
- 一列数据可以看成由相同类型元素构成的数组
- 一行数据的所有列在各自的数组中保持对其,即拥有相同的数组下标,该下标称之为序号或者行号(该序号是隐式,不需要存储)
- 表中所有行按照 维度列 做多重排序,排序后的位置就是该行的行号
<