选取适合分布的列是GBASE南大通用数据库GBase 8a分布表设计中非常重要的一步。以下是关于选择hash分布列的一些建议:
选择HASH分布键的依据遵从四大原则:
第一,就是首先保证所有节点数据存放是均匀的,避免出现节点出现数据分布过多或过少情况;
第二,如果经常进行大表连接,尽量把连接字段定义成hash 分布字段;
第三,尽量保证where 条件产生的结果集的存储也尽量是均匀的,避免在做查询的时候,出现某些节点过于繁忙或清闲的情况;
第四,选择使用频率高的group by 字段作为hash 字段。
以上是一些选择南大通用GBASE 8a hash分布列的建议,但实际上还要考虑具体业务和应用场景,以综合考虑列的选择。