Doris--基础--3.4--SQL--表的基本概念

Doris–基础–3.4–SQL–表的基本概念


1、基本概念

在 Doris 中,数据都以表(Table)的形式进行逻辑上的描述。

1.1、Row(行)和Column(列)

在这里插入图片描述

一张表包括行(Row)和列(Column)。

  1. Row:用户的一行数据。
  2. Column:用于描述一行数据中不同的字段。

1.2、Column 分为两大类

  1. Column 可以分为两大类:Key 和 Value。
  2. 从业务角度看:
    1. Key:对应维度列
    2. Value 对应指标列。
  3. 从聚合模型的角度来看
    1. Key 列相同的行,会聚合成一行。其中 Value 列的聚合方式由用户在建表时指定。

2、数据结构

在这里插入图片描述

  1. 表(Table1)拆成多个Tablet(Tablet1,Tablet2,Tablet3)
  2. 一个Tablet会存多个副本,存储在不同的 BE 中,从而保证数据的高可用和高可靠。
    1. Tablet1 分别放到BE1,BE2,BE3中
    2. Tablet1 分别放到Partition1,Partition2,Partition3中
  3. 数据主要都是存储在BE里面,BE节点上物理数据的可靠性通过多副本来实现,默认是3副本,副本数可配置且可随时动态调整,满足不同可用性级别的业务需求。FE调度BE上副本的分布与补齐。
  4. 如果说用户对可用性要求不高,而对资源的消耗比较敏感的话,我们可以在建表的时候选择建2副本或者1副本。

3、Tablet(数据分桶)和 Partition(分区)

3.1、Tablet(数据分桶)

  1. 在 Doris 的存储引擎中,用户数据被水平划分为若干个数据分片(Tablet,也称作数据分桶)。
  2. 每个 Tablet 包含若干数据行。
  3. 各个 Tablet 之间的数据没有交集,并且在物理上是独立存储的。
  4. 多个 Tablet 在逻辑上归属于不同的分区(Partition)。
  5. 一个 Tablet 只属于一个 Partition
  6. Tablet 是数据移动、复制等操作的最小物理存储单元。

3.2、Partition(分区)

  1. 一个 Partition 包含若干个 Tablet
  2. 因为 Tablet 在物理上是独立存储的,所以可以视为 Partition 在物理上也是独立。
  3. 若干个 Partition 组成一个 Table。
  4. Partition 可以视为是逻辑上最小的管理单元。数据的导入与删除,都可以或仅能针对一个 Partition 进行。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值