Aititi 集合连接 表格连接的join算法 attilax总结 艾提拉总结
常见的join算法 - CSDN博客.html
Nexted-loop join中小表驱动大表的原因分析
原创 2017年07月31日 20:53:27
· 标签:
· 414
1.
Next-loop join:
1. outer_iterator = SELECT A.xx,A.c FROM A WHERE A.xx IN (5,6);
2. outer_row = outer_iterator.next;
3. while(outer_row) {
4. inner_iterator = SELECT B.yy FROM B WHERE B.c = outer_row.c;
5. inner_row = inner_iterator.next;
6. while(inner_row) {
7. output[inner_row.yy,outer_row.xx];
8. inner_row = inner_iterator.next;
9. }
10. outer_row = outer_iterator.next;
11. }
过滤后留下的结果集M,N(M>N) 1.如果都走全表的话,大表做驱动和小表做驱动都是M*N 2.如果走索引的话: a.索引对小表的作用不会太大,对于大表索引的作用就很大了,除非索引建的不好。。 b.假设nexted-loop join中驱动表过滤后的行数为K,那么while(outer_row)一定会循环K次,这时驱动表上索引的功能是比聚簇索引占有更小的空间,一个节点上的数据量会更大些,减少随机I/O。 c.如果被驱动表过滤后的行数为W,那么在while(outer_row)中两表连接条件上被驱动表还有机会利用索引来大大减少内循环的次数。
所以过滤结果中的小表做驱动表。。
果两个表一样大,效率是一样的。 如果两个表的数据量相差很大,那效率上是有区别的。 一般来说,小表去join大表,效率要比大表去join小表高的多。 通常SQL会自动去选择效率好的查询方案。 所以写SQL尽量先查询和过滤数据量小的表,再去join大的表。