一、explain
1. explain含义
通常使用explain关键字模拟优化器执行SQL语句,从而了解MySQL如何处理SQL语句
2. explain用法
explain + SQL语句
通过explain可以分析出以下结果:
表的读取顺序
数据读取操作的基本类型
哪些索引可以使用
哪些索引被实际使用
表之间的引用
每张表有多少行被优化器查询
3. explain出来的信息
3.1、id(三种情况):select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
♠ id相同,执行顺序由上至下
♠ id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
♠ id既有相同也有不同,同时存在(id相同可以认为是一个组的,从上往下执行,然后就是,在所有组中,id值越大优先级越高)
3.2 、select_type(由六种类型): 查询类型,主要用于区别普通查询、联合查询、子查询等复杂查询
类型 | 特性 |
---|---|
simple | 简单的select查询,查询中不包含子查询或者UNION |
primary | 查询中若包含任何复杂的子部分,最外层查询则被标记为PRIMARY |
subquery | 在SELECT或WHERE列表中包含了子查询 |
derived | 在FROM列表中包含的子查询被标记为DERIVED(衍生),MySQL会递归执行这些子查询,把结果放在临时表中 |
union | 若第二个SELECT出现在UNION之后,则被标记为UNION:若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED |
union result | 从UNION表获取结果的SELECT |
3.3 、table
显示这一行的数据是关于哪张表的
3.4、partitions
相比 explain 多了个 partitions 字段,如果查询是基于分区表的话,会显示查询将访问的分区
3.5、type
所显示的是查询所使用的那种类型
最好到最差:
system > const > eq_ref> ref > range > index > all
一般来说:保证查询至少达到range级别,最好能达到ref
类型 | 特性 |
---|---|
system | 表只有一行记录(等于系统表),这是const类型的特例,平时不会出现,这个也可以忽略不计 |
const | 表示通过索引一次就找到了,const用于比较primary key或者unique索引。因此只匹配一行数据,所以很快,如将主键置于where列表中,mysql就能将该查询转换为一个常量 |
eq_ref | 唯一性索引扫描,对于每个索引键,表中都只有一条记录与之匹配。常见于主键或唯一索引扫描 |
ref | 非唯一性索引扫描,返回匹配某个单独值的所有行。本质上也是一种索引还能访问,它返回所有匹配某个单独值的行,然而,他可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体 通俗的解释:索引非唯一,条件用索引列=xxx |
range | 只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引,一般就是在你的where语句中出现了between、<、>、in等的查询,这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束于另一点,不会扫描全部索引 |
index | Full Index Scan,index与ALL区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。(也就是说虽然all和index都是读全表,但index是从索引中读取的,而all是从磁盘中读取的) 通俗的解释就是说只查带索引的字段。 |
all | Full Table Scan,将遍历全表以找到匹配的行。 |
3.6、possible_keys
显示可能应用到这张表的索引,一个或者多个( 指出MySQL能使用哪个索引在该表中找到行 )
3.7、key
实际使用的索引,若为null,则没有使用索引
3.8、key_len
表示索引中使用的字节数,可通过该列计算查询中使用的索引长度,在不损失精确型的情况下,长度越短越好,key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据定义计算而得,不是通过表内检索出的
3.9、ref
ref显示索引的哪一列被使用了,如果可能的话,是一个常数,哪些列或者常量被用于查找索引列上的值。
只有当type为ref的时候,ref这列才会有值
3.10、rows
rows根据表统计信息以及索引选用情况,大致估算出找到所需的记录所需要读取的行数,所以越小越好。可以用来查询sql的读取行数( 扫描出的行数(估算)越小越好 )
3.11、filtered
使用explain extended时会出现这个列,5.7之后的版本默认就有这个字段,不需要使用explain extended了。这个字段表示存储引擎返回的数据在server层过滤后,剩下多少满足查询的记录数量的比例,注意是百分比,不是具体记录数。
3.12、Extra
包含不适合在其他列中显示但十分重要的额外信息(执行情况的描述和说明)
Using filesort | 说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序”。 |
Using temporary | 使用了用临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by。 |
Using index | 表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错。如果同时出现using where,表明索引被用来执行索引键值的查找;如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。 |
Using where | 表明使用where过滤 |
using join buffer | 使用了连接缓存 |
impossible where | where子句的值总是false,不能用来获取任何元组 |
select tables optimized away | 在没有group by子句的情况下,基于索引优化Min、max操作或者对于MyISAM存储引擎优化count(*),不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。 |
distinct | 优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。 |
4. SQL执行顺序
select distinct
<select_list>
from
<left_table><join_type>
join <right_table> on <join_condition>
where
<where_condition>
group by
<group_by_list>
having
<having_condition>
order by
<order_by_condition>
limit <limit number>
执行顺序
1、from <left_table><join_type>
2、on <join_condition>
3、<join_type> join <right_table>
4、where <where_condition>
5、group by <group_by_list>
6、having <having_condition>
7、select
8、distinct <select_list>
9、order by <order_by_condition>
10、limit <limit_number>
二、索引
1. 含义
是数据库中用来提高性能的最常用的工具
所有mysql的列类型都可以被索引
根据存储引擎可以定义每个表的最大索引数和最大索引长度,每种存储引擎对每个表至少支持16个索引,总索引长度至少为256字节
MyISAM和InnoDB存储引擎的表默认创建的都是b+Tree索引,默认情况下,Memory存储引擎使用使用hash索引,但也支持b+Tree索引
2. 索引的作用
是为了增加查询速度而对表字段附加的一种标识。可以提高系统的性能
3. 设计索引的原则
1. 最适合索引的列是出现在where字句中的列,或连接字句中指定的列,而不是出现在select关键字后的选择列表中的列
2. 使用唯一索引,考虑列中值的分布,索引的列的基数越大,索引的效果越好。
3. 使用短索引
4. 利用最左前缀
5. 不要过度使用索引,每个额外的索引都会占用额外的磁盘空间,降低操作的性能。
6. 对于InnoDB存储引擎的表,记录会默认按照一定的顺序进行保存,
如果有主键,就会按照主键顺序进行保存,
如果没有主键,但是有唯一索引,那么按照唯一索引的顺序保存
如果既没有主键有没有唯一索引,表中会自动生成一个内部列,按照这个列的顺序进行保存
InnoDB表的普通索引都会保存主键的键值,所以主键尽可能选择较短的数据类型。
B+Tree索引和Hash索引
Hash索引在使用时有些特别需要注意:
= : 两个值进行比较,结果是0(不相等)或者1(相等)
<=> :像常规的=运算符功能一样,但是不同点就是,它可以判断null,
如果两个操作符都是null,会返回1,而不是null
如果其中一个操作符是null,会返回0,而不是null
只用于使用=或者<=>操作符的等式比较,优化器不能使用Hash索引来加速order by操作
Hash索引把数据的索引以hash形式组织起来,因此查找某条记录的时候,速度非常快,那是因为hash结构,每个键对应一个值,
而且是散列式分布,所以它并不支持范围查找和排序等功能。
B+Tree :
当使用>、<、>=、<=、between、!=、<>、like‘’操作符时,都可以使用
4. 索引的规约
1. 若查询条件中不包含索引的最左列,则无法使用索引
2. 对于范围查询,只能利用索引的最左列
3. 对于 order by a或者group by a语句,在a上建立索引,可以避免排序
4. 对于多列索引,需要所有列排序方向一致,才能利用索引。