一、StarRocks系统架构
目前笔者生产环境接触的StrarRocks版本为3.0,按照官网描述属于存算一体架构。其系统架构简图如下。
FE 负责元数据管理和构建执行计划;BE 负责实际执行以及数据存储管理,BE 采用本地存储,通过多副本的机制保证高可用。
二、常见数据分布方式
本文所讨论的分区分桶和副本概念属于数据分布(数据存储管理)的范畴。建表时通过设置合理的分区和分桶,以实现数据均匀分布和查询性能提升。
分布式数据库中,常见的数据分布方式有如下几种:Round-Robin、Range、List 和 Hash。
Round-Robin:以轮询的方式把数据逐个放置在相邻节点上。
Range:按区间进行数据分布。如上图所示,区间 [1-3]、[4-6] 分别对应不同的范围 (Range)。
List:直接基于离散的各个取值做数据分布&#