GBase 8a Mpp Cluster集群产品性能优化篇之JOIN关联策略

逐个排查右表,对于右表是分布表且破坏hash分布的,如果数据量小,直接修改为复制表,避免将大表进行拉表操作;如果数据量大(1亿以上的),通过调整gcluster_hash_redistribute_join_optimize参数进行验证,参数说明如下:

     set gcluster_hash_redistribute_join_optimize=0|1|2 

              0 -- 拉复制表 

              1 -- 重分布 

              2 -- 自动评估,根据数据量,左右表行数接近使用重分布,如果差距大,则小表拉复制表 。

     注:遇到 left join 语句时,评估右表是否建为复制的原则是:

     (1)如果右表的字段不大于10个,且记录数不大于5000万行,则右表创建为复制表;  (2)如果右表字段数大于10个,且记录数不大于1000万,则右表创建为复制表,

     (3)其它情况,右表创建为分布表,且必须指定Hash列。条件(1)和(2)满足一个,则须把右表创建为复制表。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值