GBase8a如何选择 hash 分布列

数据分布均匀是保证 GBase 8a MPP Cluster 高效并行处理能力的基础。因此定义表时, 如何选用 HASH 分布策略,保证数据分布均匀是获取高性能的关键所在。
选择的依据遵从四大原则: 
第一个就是首先保证所有节点数据存放是均匀的,避免出现节点出现数据分布过多或过少情 况;
第二,如果经常进行大表连接,尽量把连接字段定义成 hash 分布字段,这样尽量减少无效 的节点间拉表操作; 
第三,尽量保证 where 条件产生的结果集的存储也尽量是均匀的,避免在做查询的时候, 出现某些节点过于繁忙或清闲的情况; 
第四,选择使用频率高的 group by 字段作为 hash 字段。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值