小表驱动大表,跟大表驱动小表有区别吗?不都是n*m级别吗?我们来看个例子。
小表A 有id 1,2,3,4,5。
大表B 有id 1~100.
小表驱动大表拿到A表的id去B表关联,匹配5次就结束了。
大表驱动小表 ,6~100这些id其实都是匹配不到的,但还是会跟A表匹配。匹配了100次。
伪码:
小表A Set idA;
大表B Set idB;
小表驱动大表:
//遍历A表的id
for ( ida: idA ){//循环5次就ok了
//如果可以匹配到,索引是B+树匹配很快的
return idB.contains(ida);
}
大表驱动小表:
for ( id: idB ){//循环了100次
return idA.contains(idb);
}
结语:
从时间复杂度看小表驱动大表跟大表驱动小表都是o(n*m)级别的,但实际使用中会有明显的差别。宏观上看没有区别,但微观上看就区别很大了。