文章大纲 👇👇
一、性能分析(Explain)
1.1 是什么(查看执行计划)
使用
EXPLAIN
关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。
官网介绍
1.2 能干嘛
- 表的读取顺序
- 哪些索引可以使用
- 数据读取操作的操作类型
哪些索引被实际使用
- 表之间的引用
每张表有多少行被物理查询
1.3 怎么玩
- Explain + SQL语句,例如下面:
EXPLAIN SELECT * FROM t1,t2,t3,t4
- 执行计划包含的信息
- 建表脚本
CREATE TABLE t1(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
CREATE TABLE t2(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
CREATE TABLE t3(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
CREATE TABLE t4(id INT(10) AUTO_INCREMENT,content VARCHAR(100) NULL , PRIMARY KEY (id));
INSERT INTO t1(content) VALUES(CONCAT('t1_',FLOOR(1+RAND()*1000)));
INSERT INTO t2(content) VALUES(CONCAT('t2_',FLOOR(1+RAND()*1000)));
INSERT INTO t3(content) VALUES(CONCAT('t3_',FLOOR(1+RAND()*1000)));
INSERT INTO t4(content) VALUES(CONCAT('t4_',FLOOR(1+RAND()*1000)));
1.4 各字段解释
1.4.1 ① id
- select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
- 三种情况
- (1) id相同,执行顺序由上至下
EXPLAIN SELECT * FROM t1,t2,t3,t4 WHERE t1.id = t2.id AND t2.id = t3.id;
id相同,执行顺序由上至下
- (2)id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
EXPLAIN SELECT t1.id FROM t1 WHERE t1.id IN
( SELECT t2.id FROM t2 WHERE t2.id IN
( SELECT t3.id FROM t3 WHERE t3.content = '')
);
id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
- (3)id相同,不同,同时存在
EXPLAIN SELECT t2.* FROM t2,(SELECT * FROM t3 WHERE t3.content = '') s3 WHERE s3.id = t2.id;
id如果相同,可以认为是一组,从上往下顺序执行;在所有组中,id值越大,优先级越高,越先执行 衍生 = DERIVED
- 关注点
id号每个号码,表示一趟独立的查询。一个sql 的查询趟数越少越好。
1.4.2 ② select_type
- 有哪些
- 查询的类型,主要是用于区别 普通查询、联合查询、子查询等的复杂查询
(1) SIMPLE:简单的 select 查询,查询中不包含子查询或者UNION
(2) PRIMARY:查询中若包含任何复杂的子部分,最外层查询则被标记为Primary
(3) DERIVED:在FROM列表中包含的子查询被标记为DERIVED(衍生)MySQL会递归执行这些子查询, 把结果放在临时表里。
(4) SUBQUERY:在SELECT或WHERE列表中包含了子查询
(5) DEPENDENT SUBQUERY:在SELECT或WHERE列表中包含了子查询,子查询基于外层
(6) UNCACHEABLE SUBQUREY
SHOW VARIABLES LIKE ‘%lower_case_table_names%’;
SELECT @@lower_case_table_names FROM DUAL;
(7) UNION:若第二个SELECT出现在UNION之后,则被标记为UNION;
若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED
(8) UNION RESULT:从UNION表获取结果的SELECT
1.4.3 ③ table
- 显示这一行的数据是关于哪张表的
1.4.4 ④ partitions
- 代表分区表中的命中情况,非分区表,该项为null
1.4.5 ⑤ type
(1)
(2) 访问类型排列
- type显示的是访问类型,是较为重要的一个指标,结果值从最好到最坏依次是:
system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
system>const>eq_ref>ref>range>index>ALL
- 一般来说,得保证查询至少达到
range
级别,最好能达到ref
。
(3) 显示查询使用了何种类型,
从最好到最差依次是:
system>const>eq_ref>ref>range>index>ALL
- system:表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,这个也可以忽略不计
- const:表示通过索引一次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快,如将主键置于where列表中,MySQL就能将该查询转换为一个常量
- eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描
- ref:非唯一性索引扫描,返回匹配某个单独值的所有行.
本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,
它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体
- range: 只检索给定范围的行,使用一个索引来选择行。key 列显示使用了哪个索引,一般就是在你的where语句中出现了between、<、>、in等的查询,这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束语另一点,不用扫描全部索引。
- index :出现index是sql使用了索引但是
没用通过索引进行过滤
,一般是使用了覆盖索引
或者是利用索引进行了排序分组
- all:Full Table Scan,将遍历全表以找到匹配的行
- index_merge:在查询过程中需要多个索引组合使用,通常出现在有 or 的关键字的sql中
- ref_or_null:对于某个字段既需要关联条件,也需要null值得情况下。查询优化器会选择用ref_or_null连接查询。
- index_subquery:利用索引来关联子查询,不再全表扫描。
- unique_subquery :该联接类型类似于index_subquery。 子查询中的唯一索引
备注:一般来说,得保证查询至少达到range级别,最好能达到ref。
1.4.6 ⑥ possible_keys
- 显示可能应用在这张表中的索引,一个或多个。
查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
1.4.7 ⑦ key
- 实际使用的索引。如果为NULL,则没有使用索引
- 查询中若使用了覆盖索引,则该索引和查询的select字段重叠
1.4.8 ⑧ key_len
- 表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。
EXPLAIN SELECT SQL_NO_CACHE * FROM emp WHERE emp.age=30 AND emp.name LIKE 'ab%';
如何计算
1 、先看索引上字段的类型+长度比如 int=4 ; varchar(20) =20 ; char(20) =20
2 、如果是varchar或者char这种字符串字段,视字符集要乘不同的值,比如utf-8 要乘 3,GBK要乘2,
3 、varchar这种动态字符串要加2个字节
4、 允许为空的字段要加1个字节
第一组
key_len=age的字节长度+name的字节长度=4+1 + ( 20*3+2)=5+62=67
第二组
key_len=age的字节长度=4+1=5
- key_len字段能够帮你检查是否充分的利用上了索引
1.4.9 ⑨ ref
- 显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值
1.4.10 ⑩ rows
- rows列显示MySQL认为它执行查询时必须检查的行数。
越少越好
1.4.11 ⑩① filtered
- 这个字段表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数
1.4.12 ⑩② Extra
- 包含不适合在其他列中显示但十分重要的额外信息
(1)
Using filesort
出现filesort的情况:
优化后,不再出现filesort的情况:
查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
(2)
Using temporary
优化前存在 using temporary 和 using filesort
优化前存在 using temporary 和 using filesort 不在,性能发生明显变化:
(3)Subtopic
(4)USING index
- 表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错!
如果同时出现using where,表明索引被用来执行索引键值的查找;
如果没有同时出现using where,表明索引只是用来读取数据而非利用索引执行查找。- 利用索引进行了排序或分组
(5)Using where
- 表明使用了where过滤
(6)
using join buffer
- 使用了连接缓存:
(7)impossible where
- where子句的值总是false,不能用来获取任何元组
(8) select tables optimized away
- 在没有GROUPBY子句的情况下,基于索引优化MIN/MAX操作或者
对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,
查询执行计划生成的阶段即完成优化。
在innodb中:
在Myisam中: