索引是不是创建越多越好,或者给越多的字段加索引越好呢?根据上一章介绍的索引特征,我们会发现不一定。优化器本身能进行一定的优化, 原则就是基于开销cost,而不是基于规则和语义的,怎么开销小就怎么来。但是我们平时用的时候也要注意一些规则,网上总结了一下,常用规则有如下一些,那我们如何检验我们索引的效果呢?其核心就是使用explain来精准分析每条语句的执行情况,所以熟悉explain各个字段的含义和用法是基础,本文就来梳理一下相关内容。
常用的数据库设计基本原则:
1.用于where判断和order排序和jion的,on的,group by 的字段上创建索引
2.索引的个数不要过多,否则浪费空间,更新变慢。
3.过长的字段,建立前缀索引。
4.区分度低的字段,例如性别等,不要建立索引,离散度太低,导致扫描行过多。
5.频繁更新的值,不要作为主键或者索引,这导致页分裂
6.随机无序的值,不要建立索引,例如身份证,UUID等。无序导致页分裂
7.组合索引把离散度高的值放在前面
8.创建复合索引,而不是修改单例索引。
3.2 什么时候用不到索引
1.索引上使用函数,表达式计算
2.字符串不加引号,出现隐式转换
3.like条件前面带%,过滤的开销太大,可以用全文索引
4.负向查询 例如not like就不能。!=,<>,和not in 在某些情况下可以。
1 explain是什么
(1) explain的含义
是查看执行计划。使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈
(2)explain能干嘛
- 表的读取顺序
- 数据读取操作的操作类型
- 哪些索引可以使用
- 哪些索引被实际使用
- 表之间的应用
- 每张表有多少行被优化器查询
(3)如何使用
非常简单,在SQL之前加explain就行了,其包含的内容为下面的显示的查询列表的每个列名称:
如果要熟练使用explain分析性能,我们必须对每个字段的含义非常熟悉,现在我们先看一下各个字段的含义.
2 explain各个字段的含义
2.1 id字段
select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序
该字段会有三种情况:
1.id相同,执行顺序由上至下
2.id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
3.id相同不同,同时存在
上面的是什么意思呢?
先看第一种:id相同,执行顺序由上至下
我们现在假定有三张表t1,t2和t3,执行这样一个语句:
id都为1,根据上述说明是顺序加载,也就是下面的红框里的t1,t3和t2,而我们理解应该是t1,t2,t
3的顺序加载的,两者明显不一样,但是这里告诉我们了计算机如何进行加载的。
第二种:id不同,如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
如果是子查询,id序号会递增,id值越大优先级越高,越先被执行,这里的加载顺序就是t3,t1和t2,这就是计算机理解的顺序
这里我们也能看到后面两个的类型是子查询subquery。
第三种 id相同不同,同时存在
看这个例子:
这里的t1是一个衍生出来的表,所以table属性为derived(衍生),后面的参数2表示从表2衍生出来的。
2.2 select_type 字段
查询的类型,主要是用于区别普通查询、联合查询、子查询等的复杂查询,一共有6种:
- SIMPLE:简单的select查询,查询中不包含子查询或者UNION。
- PRIMARY:查询中包含任何复杂的子部分,最外层查询则被标记为PRIMARY。
- SUBQUERY:在select或者where中包含了子查询。
- DERIVED:在FROM列表中包含的子查询被标记为DERIVED(衍生)。MySQL会递归执行这些子查询,把结果放在临时表里。
- UNION:若第二个SELECT出现在UNION之后,则被标记为UNION;若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED。
- UNION RESULT:从UNION表中获取结果的SELECT
比如这个例子:
2.3 table字段
显示这一行的数据是关于哪些表的。id列会重复,但是整体是递增的,可以根据table字段判断顺序号对应的是哪个表。
2.4 type
特别重要的字段
type代表了查询用了何种类型,一共12种,结果值从最好到最坏依次是:
system>const>eq_ref>ref>fulltext>ref_or_null>index_merge>unique_subquery>index_subquery>range>index>All
查询常用有7种类型,从最好到最差以此为:
system>const>eq_ref>ref>range>index>ALL
这些类型的含义是:
①system:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现,这个也可以忽略不计。
②const:表示通过索引一次就找到了,const用于比较primary key或则unique索引。因为只匹配一行数据,所以很快。如将主键置于where列表中,MySQL就能将该查询转换为一个常量。
③eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描。
④ref:非唯一性索引扫描,返回匹配某个单独值的所有行。本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以它应该属于查找和扫描的混合体。
⑤ range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引。一般就是在你的where语句中出现了between、<、>、in等的查询。这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束于另一点,不会扫描全部索引。
⑥index:全索引扫描,index与All区别为index类型只遍历索引树。这通常比All快,因为索引文件通常比数据文件小。(也就是说虽然all和index都是读全表,但index是从索引中读取的,而all是从硬盘中读的)
⑦all:全表扫描,将遍历全表以找到匹配的行。
一般来说,得保证查询至少达到range级别,最好能达到ref。
看几个例子:
system和const 其实就是 单行 单表 这样查询速度的确最快。
eq_ref是这样的:
ref就是正常使用索引查到的,例如下面的代码为t1表的两个字段col1,col2创建了一个索引,然后查询时使用了col1:
range是范围查找,比全表查要好一些:
index是全索引扫描,这里其实就是为id建立了索引,不用进行全表扫描,这其实就是查不到时的场景。
全表扫描,没有索引,又不存在时,一定是全表扫描了。
2.5 possible_keys和key
possible_keys显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出。但不一定被查询实际使用。
key是实际使用的索引。如果为NULL,则没有使用索引。查询中若使用了覆盖索引,则该索引仅出现在key列表中,不会出现在possible_keys列表中。(覆盖索引:查询的字段与建立的复合索引的个数一一吻合)
覆盖索引:select 后面接的字段(下面为col1,col2)和创建的复合索引的个数和顺序一模一样,例如:
2.6 key_len
表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好。key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的。例如
2.7 ref
显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值。查询中与其它表关联的字段,外键关系建立索引。
2.8 rows
根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数。
2.9 Extra
包含不适合在其他列中显示但十分重要的额外信息。比较重要的有:
-
Using filesort:说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作成为“文件排序”。
-
Using temporary:使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by。
-
Using index:表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错!如果同时出现using where,表明索引被用来执行索引键值的查找;如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。
-
Using where:表明使用了where过滤。
-
Using join buffer:使用了连接缓存。
-
impossible where:where子句的值总是false,不能用来获取任何元组。(查询语句中where的条件不可能被满足,恒为False)
-
select tables optimized away:在没有GROUPBY子句的情况下,基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作,不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化。
-
distinct:优化distinct操作,在找到第一匹配的元组后即停止找相同值的动作。
3 看一个热身case
这个说明了什么呢?根据id越大越早执行的原则:
首先执行的是第四行,id为4,select_type为union里的第二个select,最先执行[select name id from t2]
之后执行的是第二行,id为3,是整个查询中第三个select的一部分,因查询包含在from中 ,所以是derived[select t1 where other_column=""]
之后执行的是第三行,id为2,select列表中的子查询select_type为subquery,为整个查询中的第二个select[select id from t3]
之后执行第一行,id为1,表示union里的第一个select,select_type列的primary表示该查询为外层查询,table被标记为,表示查询结果来自一个衍生表,其中derived3里 的3表示该查询衍生自第三个select查询,[select d1.name …]