Gbase8s数据模型规划介绍

GBase 8s MPP中,数据是按表存放的,因此数据模型规划阶段需要对数据表的分布策略进行仔细规划。GBase 8s MPP中的表可以分为如下类别:

  • 复制表:在集群中复制表所在的Distribution中的每个节点都保存一份全量数据,再与其它表进行关联查询时可以直接在本节点上完成,无需与其它节点进行交互,因此性能最优。但由于各个节点上数据完全相同,导致存储空间增加,因此通常用于小表、维度表或经常需要JOIN关联的数据表。
  • 分布表:将数据分布存储到不同的节点上。每个节点上存储一部分数据(分片存储),根据不同应用场景,GBase 8s MPP提供如下四种分布表:
  • 哈希分布表:将表中某列指定为哈希列,然后将数据按照哈希算法的取值存储到不同的节点上。每个节点上只存储一部分数据。这种存储策略,将大表数据进行分拆,实现分布式存储。哈希分布表,经常用于对哈希列进行等值查询的场景,是大型数据中心最常用的数据分布方式。
  • 范围分布表:表中数据按照指定的范围,分布到不同的节点上。
  • 列表分布表:表中数据按照列表中给定的值,分布到不同的节点上。
  • 随机分布表:将数据随机存储到不同的节点上,每个节点只存储一部分数据,各个节点上的数据量接近。这种数据分布方式,通常用于对数据进行汇总计算的场景。

对于分布表,还需要考虑数据的高可用,即需要确定备份个数及备份策略,最多支持备份个数为两个,满足不同的高可用需求。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值