Mysql之小表驱动大表
1 什么是小表驱动大表
用小的数据集去驱动(可理解为匹配)大的数据集
2 为什么使用小表驱动大表
表A有20条数据,表B有20万数据.外部执行一次连接,内部要执行多次.
按照小表驱动大表,即A驱动B
for(20条){
for(20万条){
}
}
大表驱动小表,即B驱动A
for(20万){
for(20条){
}
}
- 小的循环在外层,表连接需要20次
- 大的循环在外层,表连接需要20万次,浪费数据库资源
总结: 小表驱动大表的主要目的是通过减少表连接创建的次数,加快查询速度.
3 判断驱动表与非驱动表
-
1 LEFT JOIN 左连接,左边为驱动表,右边为被驱动表.
-
2 RIGHT JOIN 右连接,右边为驱动表,左边为被驱动表.
-
3 INNER JOIN 内连接, mysql会选择数据量比较小的表作为驱动表,大表作为被驱动表.
-
4 可通过EXPLANIN查看SQL语句的执行计划,EXPLANIN分析的第一行的表即是驱动表.
LEFT JOIN :左连接小表驱动大表
1 左边是驱动表,右边是被驱动表
2 小表驱动大表优于大表驱动小表
3 驱动表索引没有生效,被驱动表索引有效
LEFT JOIN: 内连接,表1驱动表2
1 数据库会自动选择数据量小的作为驱动表,大表作为被驱动表
2 执行效率,和左连接执行效率相差不大
3 驱动表索引没有生效,被驱动表索引有效
4 Exists和in的使用场景
SELECT * FROM A WHERE ID IN (SELECT ID FROM B)
当B表的数据较小时,IN 优于Exists.
SELECT * FROM A WHERE EXISTS (SELECT 1 FROM B WHERE B.ID = A.ID)
当A表的数据集小于B表时,用Exists优于IN.
参考资料: