在实际工作或者面试中,经常会碰到MySQL索引、SQL优化方面的问题。本文将全面解读MySQL的执行计划以及SQL优化,这里默认采用Innodb存储引擎。
执行计划是什么
使用Explain关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的,分析查询语句或是表结构的性能瓶颈。
语法:Explain + SQL语句
执行计划包含的信息
id:查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序。
- id相同:执行顺序由上至下。
- id不同:如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行。
- 同时存在时:id不同的值越大优先级越高,越先被执行,id相同的执行顺序由上至下。
select_type:查询的类型,主要是用于区别普通查询、联合查询、子查询等的复杂查询。
- SIMPLE:简单的select查询,不包含子查询或union。
- PRIMARY:查询中若包含任何复杂的子部分,最外层查询则被标记为PRIMARY。
- SUBQUERY:在SELECT或WHERE列表中包含的子查询。
- DERIVED:在FROM列表中包含的子查询被标记为DERIVED(衍生) MySQL会递归执行这些子查询, 把结果放在临时表里。
- UNION:若第二个SELECT出现在UNION之后,则被标记为UNION;若UNION包含在FROM子句的子查询中,外层SELECT将被标记为DERIVED。
- UNION RESULT:从UNION表获取结果的SELECT。
table:显示这一行的数据是关于哪张表的。
type:显示的是访问类型,是较为重要的一个指标,结果值从最好到最坏依次是:system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL,一般至少需要优化到range。
一般常用的type类型:
- system:表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,这个也可以忽略不计。
- const:表示通过索引一次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据,如将主键置于where列表中,MySQL就能将该查询转换为一个常量。
- eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描。
- ref:非唯一性索引扫描,返回匹配某个单独值的所有行。本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体。
- range:只检索给定范围的行,使用一个索引来选择行。key 列显示使用了哪个索引。一般就是在你的where语句中出现了between、<、>、in等的查询,这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束语另一点,不用扫描全部索引。
- all:Full Table Scan,将遍历全表以找到匹配的行。
possible_keys:实际使用的索引。如果为NULL,则没有使用索引。查询中若使用了覆盖索引,则该索引和查询的select字段重叠。
key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好。
key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。
ref:显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。
rows:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数。
Extra:包含不适合在其他列中显示但十分重要的额外信息。
- Using filesort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序”。
- Using temporary:使了用临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序 order by 和分组查询 group by。
- Using index:是否用了覆盖索引。
- Using where:表明使用了where过滤。
- Using join buffer:使用了连接缓存。
- Impossible where:where子句的值总是false,不能用来获取任何元组。
SQL优化的十大原则
- 尽量全值匹配:建立几个复合索引字段,最好就用上几个字段。且按照顺序来用。
- 最佳左前缀法则:如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。
- 不在索引列上做任何操作:不在索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描。
- 范围条件放最后:存储引擎不能使用索引中范围条件右边的列。
- 覆盖索引尽量用:尽量使用覆盖索引(只访问索引的查询(索引列和查询列一致)),减少select * 。
- 不等于要甚用:mysql 在使用不等于(!= 或者<>)的时候无法使用索引会导致全表扫描。
- Null/Not 有影响:注意null/not null对索引的可能影响。
- Like查询要当心:like以通配符开头('%abc...')mysql索引失效会变成全表扫描的操作。
- 字符类型加引号:字符串不加单引号索引失效。
- OR改UNION效率更高