GBase8a分布列选取原则

最新推荐文章于 2024-03-08 10:49:54 发布

lbfk

最新推荐文章于 2024-03-08 10:49:54 发布

阅读量448

点赞数

文章标签：数据库架构

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lbfk/article/details/123812961

版权

优先考虑大表间的 JOIN ，尽量让大表 JOIN 条件的列为 Hash 分布列（相关子查询的相关 JOIN 也可以参考此原则），以使得大表间的 JOIN 可以直接下发到各节点分布式执行。其次考虑 GROUPBY ，尽量让 GROUPBY 带有 Hash 分布列，让分组聚合一步完成。当有多个 join 或group 列可选择时，优先选择唯一值多（ count(distinct) 值大）的列做 Hash 分布列，让数据均匀分布。通常是等值查询的列，并且使用的频率很高的应考虑建立为 hash 分布列。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
GBase8a分布列选取原则

优先考虑大表间的JOIN，尽量让大表JOIN条件的列为Hash分布列（相关子查询的相关JOIN也可以参考此原则），以使得大表间的JOIN可以直接下发到各节点分布式执行。其次考虑GROUPBY，尽量让GROUPBY带有Hash分布列，让分组聚合一步完成。当有多个join或group列可选择时，优先选择唯一值多（count(distinct)值大）的列做Hash分布列，让数据均匀分布。通常是等值查询的列，并且使用的频率很高的应考虑建立为hash分布...
复制链接

扫一扫

博客等级

码龄19年

58
原创

3
点赞

14
收藏

1
粉丝

关注

私信

热门文章

最新评论

GBase 8a 集群修改 IP 地址操作步骤
妞果: 补充：ip 和node id 计算方法如上：根据corosync-cfgtool -s 计算出的ip 地址172.16.47.164 对应的node id 为2754547884。由ip 地址计算node id： 172.16.47.164 倒排 164 47 16 172 将四个部分分别转为16 进制 A4 2F 10 AC 将16 进制数A42F10AC 转为10 进制，即得到对应的node id：2754547884。由node id 计算ip 的方法把上面过程逆转即可。

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。