一、mysql查询优化器(mysql query optimizer)
二、mysql常见瓶颈
- CPU:CPU在饱和的时候一般发生在数据装入内存或从磁盘上读取数据的时候
- IO:磁盘I/O瓶颈发生在装入数据远大于内存容量的时候
- 服务器硬件性能瓶颈:top,free和vmstat来查看系统的性能状态
三、explain
explain是什么(查看执行计划)
使用explain关键字可以模拟优化器执行sql查询语句,从而知道mysql是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。explain官网介绍
explain能帮助我们了解sql查询过程中如下信息:
- 表的读取顺序
- 数据读取操作的操作类型
- 哪些索引可以使用
- 哪些索引被实际使用
- 表之间的引用
- 每张表有多少行被优化器查询
语法:explain + select语句
四、explain各个字段解析
1、id
select查询的序列号,包含一组数字,表示查询中执行select子句 或操作表的顺序
id的解析有三种情况:
(1)、id相同,执行顺序由上到下(执行顺序t1-t3-t2)
(2)、id不同,如果是子查询,id的序号会递增,id值越大优先级越高 ,越先被执行(执行顺序t3-t1-t2)
(3)、id相同不同,同时存在(执行顺序:t3-)
id如果相同,可以认为是一组,从上往下顺序执行
在所有组中,id值越大,优先级越高,越先执行
derived2:derived是衍生表,也就是虚表,这里的2值的是id为2
2、select_type
查询的类型,主要是区别普通查询、联合查询、子查询等复杂查询
类型:simple、primary、subquery、derived(衍生)、union、union result
- simple:简单的select查询,查询中不包含子查询或者union
- primary:查询中若包含任何复杂的子部分,最外层查询则被标记为primary
- subquery:在select或where列表中包含了子查询
- derived:在from列表中包含了子查询被标记为derived(衍生),mysql会递归执行这些子查询,把结果放在临时表里
- union:若第二个select出现在union之后,则被标记union;若union包含在from子句的子查询中,外层select将被标记为:derived
- union result:从union表获取结果的select
3、table:显示这行数据是关于哪张表的
4、type:访问类型排序(如下8种)
显示了查询使用了那种类型
从最好到最差:system>const>eq_ref>ref>range>index>all(一般来说,得保证查询至少达到range级别,最好能达到ref)
- system:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现,这个也可以忽略不计
- const:表示通过索引一次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快;如果将主键置于where列表中,mysql就能将该查询转换为一个常量
- eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描(eg:查公司CEO,只有一个记录匹配)
- ref:非唯一性索引扫描,返回匹配某个单独值得所有行。其本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以它应该属于查找和扫描的混合体(与eq_ref对比,有多个记录与之匹配)
- range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引,一般就是在你的where语句中出现了between、>、<、in等的查询;这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束与另一点,不用扫描全部索引。
- index:Full Index Scan,index与All区别为index类型只遍历了索引树。这通常比All快,因为索引文件通常比数据文件小。也就是说虽然all和index都是读全表,但是index是从索引(内存)中读取的,而all是从硬盘中读取的;index少了一些IO。
- all:Full table scan,将遍历全表以找到匹配的行
5、possible_keys(理论上):显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段若存在索引,则该索引将被列出,但不一定被查询实际使用
6、key(实际上):实际使用的索引,如果为null ,则没有使用索引。查询中若使用了覆盖 索引,则该索引只出现在key列表中
7、key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引长度。再不损失精确性的前提下,长度越短越好;key_len显示的值为索引字段的最大可能长度,并非实际使用长度。即key_len是根据表定义计算而得,不是通过表内检索出的
8、ref:显示索引的哪一列被使用了,如果可能的话是一个常数。那些列或常量被用于查找索引列上的值
9、rows:根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数
10、extra:包含不适合在其他列中显示但十分重要的额外信息
- using filesort: mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。mysql中无法利用索引完成的排序操作称为“文件排序”。
- using temporary:使用了临时表保存中间结果 ,mysql在对查询结果排序时使用临时表。常见于排序order by 和分组查询group by
- using index:表示相应的select操作中使用了覆盖索引(covering index),避免访问了表的数据行,效率不错;如果同时出现using where,表明索引被用来执行索引键值的查找;如果没有同时出现using where,表明索引用来读取数据而非执行查找动作。
覆盖索引:也有说是索引覆盖。
理解方式一:就是select的数据列只用从索引中就能够取得,不必读取数据行,mysql可以利用索引返回select列表中的字 段,而不必根据索引再次读取数据文件,换句话说查询列要被所建的索引覆盖。
理解方式二:索引是高效找到行的一个方法,但是一般数据库也能使用索引找到一个列的数据,因此它不必读取整个行。毕竟索引叶子节点存储了他们索引的数据;当能通过读取索引就可以得到想要的数据,那就不需要读取行了。一个索引包含了(或覆盖了)满足查询结果的数据就叫覆盖索引。
如果要使用覆盖索引,一定要注意select列表中只取出需要的列,不可select *,因为如果将所有字段一起做索引会导致索引文件过大,查询性能下降。
- using where:表明使用了where过滤
- using join buffer: 使用了连接缓存
- impossible where: where子句的值总是false,不能用来获取任何元组
- select tables optimized away:在没有Group by 子句的情况下,基于索引优化min/max操作或者对于MyISAM存储引擎优化count(*)操作,不必等到执行阶段在进行计算,查询执行计划生成的阶段即可完成优化。
- distinct:优化distinct操作,在找到第一匹配的元组后即停止找同样值的而动作
五、explain小case