1、查询语句中不要使用*
尽量避免使用select *,返回无用的字段会降低查询效率。如下:
SELECT * FROM t
优化方式:使用具体的字段代替*,只返回使用到的字段。
2、尽量减少子查询
尽量减少子查询,使用关联查询(left join, right join, inner join)代替;
3、减少使用IN或者NOT IN
减少使用IN或者NOT IN,使用exists,not exists或者关联查询语句代替;
IN肯定会走索引,但是当IN的取值范围较大时会导致索引失效,走全表扫描。
4、尽量避免在 where 子句中使用 or 来连接条件
应尽量避免在 where 子句中使用 or 来连接条件,如果一个字段有索引,一个字段没有索引,将导致引擎放弃使用索引而进行全表扫描,尽量用union或者union all代替(在确认没有重复数据或者不用剔除重复数据时,union all会更好);
SELECT * FROM t WHERE id = 1 OR id = 3
优化方式:可以用union代替or。如下:
SELECT * FROM t WHERE id = 1
UNION
SELECT * FROM t WHERE id = 3
(PS:如果or两边的字段是同一个,如例子中这样。貌似两种方式效率差不多,即使union扫描的是索引,or扫描的是全表)
5、合理的增加冗余的字段(减少表的关联查询);
6、增加中间表进行优化:
这个主要是在统计报表的场景,后台开定时任务将数据先统计好,尽量不要在查询的时候去统计;
7、建表的时候能使用数字类型的字段就使用数字类型
建表的时候能使用数字类型的字段就使用数字类型(type,status…),数字类型的字段作为条件查询比字符串快。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符,而对于数字型而言只需要比较一次就够了;
8、那些可以过滤掉最大数量记录的条件必须写在where字句的最末尾;
9、尽量避免在where子句中对字段进行null值判断,
否则将导致引擎放弃使用索引而进行全表扫描;
SELECT * FROM t WHERE score IS NULL;
优化方式:可以给字段添加默认值0,对0值进行判断。如下:
SELECT * FROM t WHERE score = 0;
10、应尽量避免在 where 子句中使用 != 或 <> 操作符
否则将引擎放弃使用索引而进行全表扫描;
11、应尽量避免在 where 子句中对字段进行表达式、函数 操作
这将导致引擎放弃使用索引而进行全表扫描;
SELECT * FROM t2 WHERE score/10 = 9
SELECT * FROM t2 WHERE SUBSTR(username,1,2) = 'li'
优化方式:可以将表达式、函数操作移动到等号右侧。如下:
SELECT * FROM t2 WHERE score = 10*9
SELECT * FROM t2 WHERE username LIKE 'li%'
13、复合索引使用,索引会失效问题
在使用索引字段作为条件时,如果该索引是复合索引,那么必须使用到该索引中的第一个字段作为条件时才能保证系统使用该索引,否则该索引将不会被使用,并且应尽可能的让字段顺序与索引顺序相一致;
14、索引并不是越多越好
索引固然可以提高相应的 select 的效率,但同时也降低了 insert 及 update 的效率,因为 insert 或 update 时有可能会重建索引,所以怎样建索引需要慎重考虑,视具体情况而定。一个表的索引数最好不要超过6个,若太多则应考虑一些不常使用到的列上建的索引是否有 必要;
15、使用like关键字模糊查询 索引问题:
% 放在前面索引不起作用,只有“%”不在第一个位置,索引才会生效。
例:like ‘%文’–索引不起作用;
16、对查询进行优化,应尽量避免全表扫描:
首先应考虑在where以及order by涉及的列上建立索引。