将小表(内表)存于hash area内存中用作hash table,之后全扫描大表(外表)的每条记录并在连接的列上做哈希算法,查询是否能匹配hash table。如果内存放不下小表则需要把小表按照一定的哈希算法进行分割,同时大表也根据相应的算法进行分割,然后大表相应的块与小表相应的块生成的hash table进行join,最后把所有join的结果合并起来。对于Hash Join,有无Index没有什么影响,另外处理内存中的hash table比b-tree index更为迅速。
Nest Loop一般适合于被连接的数据子集较小的情况下,内表(大表)被外表(小表)驱动,外表返回的每一行都要在内表中检索与之匹配的行。把返回子集小的作为外表,并且在内表的关联字段上有索引。对于Nest Loop,如果内表关联字段没有Index,性能会相差很大。
通常情况下Hash Join要比Sort Merge好,但如果行源已经排序,在排序合并时不需要排序了,那么排序合并的效率就会优于Hash Join。对于Sort Merge,如果两个表的连接上均有索引会更适合一些,因为索引本身就是排好序的。