0. 生产过程
- 观察:至少跑1天,看慢sql情况
- 慢查询的开启与捕获:开启日志,设置阈值,比如超过10s的就是慢sql,将其抓取
- explain + 慢sql 分析
- 进一步分析,show profile查询sql在MySQL服务器里的执行细节和生命周期情况
- 进行SQL数据库服务器的参数调优(DBA)
1. 查询优化
1.1 小表驱动大表
类似for循环
for(int i=5;.......)
{
for(int j=1000;......)
{}
}
如果小的循环在外层,对于数据库连接来说就只连接5次,进行5000次操作
如果1000在外,尽管总共也是进行5000次操作,但需要进行1000次数据库连接,从而浪费资源,增加消耗
原理:A是大表,B是小表
select * from A where A.id in(select B.id from B)
等价于
for select * from B
for select * from A where A.id = B.id
结论:当B表数据集小于A表数据集,用in
select * from A where exists (select 1 from B where B.id=A.id)
等价于
for select * from A
for select * from B where B.id=A.id
结论:当A表数据集小于B表数据集,用exists
对于exists
select …from table where exists(subquery)
可以理解为:将主查询的数据放入子查询中做条件验证,根据验证结果(true或false)来决定主查询的数据是否得以保留
1.exists (subquery) 只返回true或false,因此子查询中的select * 也可以是select 1 或 select ‘X’,官方说法是实际执行是会忽略select清单,因此没有区别。
2.exists 子查询的实际执行过程可能经过优化而不是我们理解上的逐条对比,如果担心效率问题,可以进行实际检验以确定是否有效率问题。
3.exists 子查询往往也可以用条件表达式、其他查询或者JOIN来代替,何种最优需要具体问题具体分析。