SQL Server hash join算法的简单描述

最新推荐文章于 2024-12-10 19:25:05 发布

原创最新推荐文章于 2024-12-10 19:25:05 发布 · 1.1k 阅读

·

1

·

CC 4.0 BY-SA版权

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

文章标签：

SQL tunning 专栏收录该内容

3 篇文章

订阅专栏

本文通过实例解释了SQLServer中HashJoin的工作原理。利用模运算将数据分桶，减少比较次数，提高多表连接效率，并介绍了其与Nested Loop Join的区别。

举一个简单的例子来说明SQL Server 中hash join的算法.

例如有两张表, 每张表都有10000行的记录, 假设做join的两个字段都是从1到10000的序数.

如果要做hashjoin, 那么首先对其中的一个表上的列进行hash运算, 将生成相同值的列放在一个桶里.

为了简单起见, 假定这里的hash运算就是模100, 那么这些行经过hash运算后, 会生成100组数据,也就是100个桶. 每个桶中都是100条除100后余数相同的记录.

然后对另一个表中的join列做相同的hash运算, 根据得到的余数,放入对应的桶里.

于是得到的结果就是100个hash桶中, 每个桶中都有200条记录, 分别来自两个表.

然后在桶内,再做nested loop join, 这样一个桶中最多做100*100次的比对, 100个桶最多做1,000,000次的比对.

而如果一开始就用nested loop join, 则最多需要做10000*10000次, 也就是100,000,000次. 两种算法就比对的次数来说,相差了100倍, 差异是很明显的.

另外在多cpu的服务器上, hashjoin可以并行的执行,而nestedloop join 通常只能串行的执行,这就使执行时间的差异更加明显.

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。