SQL Server hash join算法的简单描述

举一个简单的例子来说明SQL Server 中hash join的算法.

例如有两张表, 每张表都有10000行的记录, 假设做join的两个字段都是从1到10000的序数.

如果要做hashjoin, 那么首先对其中的一个表上的列进行hash运算, 将生成相同值的列放在一个桶里.

为了简单起见, 假定这里的hash运算就是模100, 那么这些行经过hash运算后, 会生成100组数据,也就是100个桶. 每个桶中都是100条除100后余数相同的记录.

然后对另一个表中的join列做相同的hash运算, 根据得到的余数,放入对应的桶里.

于是得到的结果就是100个hash桶中, 每个桶中都有200条记录, 分别来自两个表.

然后在桶内,再做nested loop join, 这样一个桶中最多做100*100次的比对, 100个桶最多做1,000,000次的比对.

 而如果一开始就用nested loop join, 则最多需要做10000*10000次, 也就是100,000,000次. 两种算法就比对的次数来说,相差了100倍, 差异是很明显的.

另外在多cpu的服务器上, hashjoin可以并行的执行,而nestedloop join 通常只能串行的执行,这就使执行时间的差异更加明显.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值