GBase 8a MPP Cluster可处理PB级别以上的结构化数据,采用hash或random分布策略进行数据分布式存储。用户可以按照业务场景的需求,自定义数据分布策略,从而在性能、可靠性和灵活性间获得最佳匹配。
- 随机分布模式
随机分布模式是指数据库创建随机分布的分布表,在对其进行加载时按随机模式分发数据内容。
- 哈希模式
哈希模式是指在加载之前先对原始数据中的每条数据中指定的哈希列进行处理,处理后的数据按照哈希值装入特定的哈希桶中,每个哈希桶对应一个集群节点。这样每个节点所得到的数据就都具有了某种共同特征(指定列都具有相同的哈希值),在查询时优化引擎可以根据这些共同特征对查询计划进行优化,以达到缩短查询时间的目的。