hash join被用来进行natural join和equi-join
hash function h is used to partition tuples of both relations
basic idea:
partition tuples of each of relations into sets that have the same hash value on the join attributes.
把tuple 使用hash 函数进行parition,hash函数的输入为join attributes,分为很多个partition,每一个partition里的join attribute输入到h中后都会返回一样的值
Assumptions
- 使用关系r和关系s中的join attribute作为hash函数的输入,如果返回了一样的值,r和s的join attribute通过h指向的partition中 joint attr
ibute相同。
- 假设 使用关系r和关系s
中的join attribute作为输入,根据其输出的值将r分为r1 - rn n个partition ,其中r1 代表包含使得h返回1的join attribute的所有的tuple,将s分为 s1-sn个partition,那么我们只需要将r1和s1进行join,rn和rn进行join即可。