分布式join和agg的实现方式

qhaoma

已于 2024-07-31 14:06:37 修改

阅读量652

点赞数 22

文章标签：分布式 database sql mysql 数据库 flink

于 2024-07-31 14:05:23 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qhaoma/article/details/140820878

版权

Join

单机join基本算法

1.Hash Join：
对数据没有要求，对SQL有要求，必须要有等值连接条件，例如t1.colA = t2.colB。OLAP一般都会实现Hash join，计算速度快，且用户的很多join场景都是带有等值连接条件的。

2.Merge Sort Join：
左表和右表的数据都是有序的，排序的列，是Join Key的子集，也就是Join Key部分列有序就可以。

3.Nestloop Join：
不要求数据有序，不要求SQL有等值连接条件。一般在数据无序且SQL中没有等值连接条件，此时无法使用上述的两种方法，才不得已使用此方法。效率最低，但适应范围最广，MySQL的最爱，在8.0.18之后才支持Hash Join，之前都是Nestloop Join，并且为了加速，还建了索引。
Flink的Interval join，用的是Nestloop Join方法，
在这里插入图片描述

分布式Join基本算法

与单机Join的区别是，需要先对数据进行重分布，重分布要在保证计算结果正确的前提下，优先提升计算速度，尽

最低0.47元/天解锁文章

关注

22
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qhaoma CSDN认证博客专家 CSDN认证企业博客

码龄17年

1: 原创

98万+: 周排名

20万+: 总排名

652: 访问

: 等级

34: 积分

10: 粉丝

22: 获赞

0: 评论

11: 收藏

私信

关注

热门文章

分布式join和agg的实现方式 652

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。