MySQL查询优化
在使用mysql的过程中,随着数据量的增大,sql语句的优化是必不可少的,而优化中一个非常实用的工具就是explain。
这里啰嗦几句mysql,不喜欢的可以跳过直接看下面。
先看一下mysql的逻辑结构,如图
(图片来自网络,mysql 版本为5.6)
mysql 经常使用的引擎为 myisam 和 innodb
下图为Innodb引擎 结构体系图:
了解操作系统的都知道,磁盘的IO操作时非常耗时的,因次mysql有创建索引加速这一过程。索引不是本篇重点,不了解的可以点这里简单了解一下:
图形式理解myisam和innodb索引区别
进入正题:
先上个截图,explain执行后有以下几个字段:
- id:每个select子句的标识id
- select_type: 查询类型
- table:当前表名
- partitions 显示查询将访问的分区,如果你的查询是基于分区表
-
type:当前表内访问方式
- possible_keys:可能使用到的索引
- key:经过优化器评估最终使用的索引
-
key_length:使用到的索引长度
- ref:引用到的列
-
rows: 要得到最终记录索要扫描经过的记录数
- filtered:表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数。
-
extra:额外的信息说明
优化时需要更加关注的列我已经加粗显示。
type
依次从好到差:system,const,eq_ref,ref,fulltext,ref_or_null,unique_subquery,index_subquery,range,index_merge,index,ALL,
除了all之外,其他的type都可以使用到索引,除了index_merge之外,其他的type只可以用到一个索引
A:system:
表中只有一行数据或者是空表,且只能用于myisam和memory表。
如果是Innodb引擎表,type列在这个情况通常都是all或者index
B:const:
使用唯一索引或者主键,返回记录一定是1行记录的等值where条件时,通常type是const。
其他数据库也叫做唯一索引扫描
C:eq_ref:
出现在要连接过个表的查询计划中,驱动表只返回一行数据,
且这行数据是第二个表的主键或者唯一索引,且必须为not null;
唯一索引和主键是多列时,只有所有的列都用作比较时才会出现eq_ref
D:ref:
不像eq_ref那样要求连接顺序,也没有主键和唯一索引的要求、只要使用相等条件检索时就可能出现;
常见与辅助索引的等值查找。或者多列主键、唯一索引中,使用第一个列之外的列作为等值查找也会出现;
返回数据不唯一的等值查找就可能出现。
E:fulltext:
全文索引检索,要注意,全文索引的优先级很高;
若全文索引和普通索引同时存在时,mysql不管代价,优先选择使用全文索引
F:ref_or_null:
与ref方法类似,只是增加了null值的比较。实际用的不多。
G:unique_subquery:
用于where中的in形式子查询,子查询返回不重复值唯一值
H:index_subquery:
用于in形式子查询使用到了辅助索引或者in常数列表,子查询可能返回重复值;
可以使用索引将子查询去重。
I:range:
索引范围扫描;
常见于使用>,<,is null,between ,in ,like等运算符的查询中。
J:index_merge:
表示查询使用了两个以上的索引,最后取交集或者并集,常见and ,or的条件使用了不同的索引;
官方排序这个在ref_or_null之后,但是实际上由于要读取所个索引,性能可能大部分时间都不如range
K:index:
索引全表扫描,把索引从头到尾扫一遍;
常见于使用索引列就可以处理不需要读取数据文件的查询、可以使用索引排序或者分组的查询。
L:all:
这个就是全表扫描数据文件;
然后再在server层进行过滤返回符合要求的记录。
key_length
用于处理查询的索引长度;越短速度越快;
rows
越少越好,扫描的记录越少、越接近结果条数越好。
extra
这个关键字可以反映出sql语句执行的流程,比如是否为索引下推、索引覆盖这些高速方式。关于该字段的详细介绍较多暂不展开,自行了解。
以上总结自网络。