多表查询优化是面试常见问题,今天整理出来:
一、驱动表选择
左右连接可以指定驱动表,但是inner join无法指定,一般是系统自动判定
1.当使用left join时,左表是驱动表,右表是被驱动表
2.当使用right join时,右表时驱动表,左表是驱动表
3.当使用join时,mysql会选择数据量比较小的表作为驱动表,大表作为被驱动表
测试:A表140多条数据,B表20万左右的数据量
select * from A a left join B b on a.code=b.code
执行时间:7.5s
select * from B b left join A a on a.code=b.code
执行时间:19s
所以普遍的优化方案是小表作为外表(驱动表),用小表去驱动大表。
有朋友可能会问,为什么驱动表的作用差异如此大呢?
因为数据存储在硬盘中,每一次连接,从硬盘读取和匹配需要耗费大量资源。所以,连接次数越少,消耗的资源就越少。
二、索引
在WHERE和JOIN中出现的列需要建立索引,根据实际情况,使用单列索引或者组合索引。
三、返回更少的数据
1、数据分页处理
2、只返回必要的字段