引入
在进行多表关联查询的时候,需要在合适的地方添加索引避免笛卡尔积操作。
select x1 from a left b on a.x1 = b.x1;
针对于以上sql,需要明确哪个是驱动表,哪个是被驱动表,left join 的话,a是驱动表,b是被驱动表,如果将上述的查询过程用java表示的话,可以是如下所示:
for(Row row : a表){
for(Row row2 : b表){
if(row.x1 == row2.x1){
break;
}
}
}
可以看到上述查询,a表是驱动表,也就是外层表,如果不对b表加索引的话,则时间复杂度应该是n*n,如果对b表添加索引则会变成如下所示:
for(Row row : a表){
if(b表.x1索引.contains(row.x1)){
xxx
}
}
则在被驱动表是走索引查询的,而不是全表查询,这样的话时间就可以提升上来了。
除了join 优化, in 、 exist也是如此。
总结
- 明确驱动表和被驱动表,给被驱动表加索引
- 设置表小的作为驱动表