mysql olap优化_MySQL之锁、事务、优化、OLAP、OLTP

六 慢查询、执行计划、sql优化

什么是慢查询

慢查询日志,顾名思义,就是查询慢的日志,是指mysql记录所有执行超过long_query_time参数设定的时间阈值的SQL语句的日志。该日志能为SQL语句的优化带来很好的帮助。默认情况下,慢查询日志是关闭的,要使用慢查询日志功能,首先要开启慢查询日志功能。

慢查询基本配置

slow_query_log 启动停止技术慢查询日志

slow_query_log_file 指定慢查询日志得存储路径及文件(默认和数据文件放一起)

long_query_time 指定记录慢查询日志SQL执行时间得伐值(单位:秒,默认10秒)

log_queries_not_using_indexes  是否记录未使用索引的SQL

log_output 日志存放的地方【TABLE】【FILE】【FILE,TABLE】

配置了慢查询后,它会记录符合条件的SQL

包括:

查询语句

数据修改语句

已经回滚得SQL

实操:

通过下面命令查看下上面的配置:

show VARIABLES like '%slow_query_log%'

show VARIABLES like '%slow_query_log_file%'

show VARIABLES like '%long_query_time%'

show VARIABLES like '%log_queries_not_using_indexes%'

show VARIABLES like 'log_output'

set global long_query_time=0;   ---默认10秒,这里为了演示方便设置为0

set GLOBAL  slow_query_log = 1; --开启慢查询日志

set global log_output='FILE,TABLE'  --项目开发中日志只能记录在日志文件中,不能记表中

设置完成后,查询一些列表可以发现慢查询的日志文件里面有数据了。

1ae27e174e0acfcf8cb3af80cf534258.png

慢查询解读

从慢查询日志里面摘选一条慢查询日志,数据组成如下

6d4151faf69a6569e997d07166d7dd92.png

第一行:用户名 、用户的IP信息、线程ID号

第二行:执行花费的时间【单位:毫秒】

第三行:执行获得锁的时间

第四行:获得的结果行数

第五行:扫描的数据行数

第六行:这SQL执行的具体时间

第七行:具体的SQL语句

执行计划(explain select...、explain extended select...)

使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。

执行计划作用

表的读取顺序

数据读取操作的操作类型

哪些索引可以使用

哪些索引被实际使用

表之间的引用

每张表有多少行被优化器查询

执行计划的语法

执行计划的语法其实非常简单: 在SQL查询的前面加上EXPLAIN关键字就行。

比如:EXPLAIN select * from table1

重点的就是EXPLAIN后面你要分析的SQL语句

002dbf96539cd67e58d1239f7d5c9551.png

ID列

ID列:描述select查询的序列号,包含一组数字,表示查询中执行select子句或操作表的顺序

根据ID的数值结果可以分成一下三种情况

id相同:执行顺序由上至下

id不同:如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行

id相同不同:同时存在

分别举例来看

7c39c0aefff2865be6ec26b9ebbf72f3.png

如上图所示,ID列的值全为1,代表执行的允许从t1开始加载,依次为t3与t2

EXPLAIN  select t2.* from t1,t2,t3  where t1.id = t2.id and t1.id = t3.id and t1.other_column = '';

Id不同

9c51d6e5d2cf60f62c5db35c99b5a227.png

b1adfd4a128c79514b5147d643b9089b.png

如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行

EXPLAIN select t2.* from  t2 where id = (

select id from t1 where id =  (select t3.id from t3 where t3.other_column='')

);

Id相同又不同

b4fae2bdd15cdd4b98e64540865eb9eb.png

id如果相同,可以认为是一组,从上往下顺序执行;

在所有组中,id值越大,优先级越高,越先执行

EXPLAIN select t2.* from (select t3.id from t3 where t3.other_column = '') s1 ,t2 where s1.id = t2.id;

select_type列

Select_type:查询的类型,要是用于区别:普通查询、联合查询、子查询等的复杂查询

类型如下

e78df96b3736b64d75622bb47ccec414.png

SIMPLE

EXPLAIN select * from t1

简单的 select 查询,查询中不包含子查询或者UNION

93d051bd096a2fe326f4ea0f3ad0a5a5.png

PRIMARY与SUBQUERY

PRIMARY:查询中若包含任何复杂的子部分,最外层查询则被标记为

SUBQUERY:在SELECT或WHERE列表中包含了子查询

EXPLAIN select t1.*,(select t2.id from t2 where t2.id = 1 ) from t1

9dc2b91e7413eca922c44fb7dc067a58.png

DERIVED

在FROM列表中包含的子查询被标记为DERIVED(衍生)

MySQL会递归执行这些子查询, 把结果放在临时表里。

525c44c128bfa68474ba454c96db7d85.png

.UNION RESULT 与UNION

UNION:若第二个SELECT出现在UNION之后,则被标记为UNION;

UNION RESULT:从UNION表获取结果的SELECT

#UNION RESULT ,UNION

EXPLAIN select * from t1 UNION select * from t2

8eb11081eb282b879308646ca540b2c1.png

table列

显示这一行的数据是关于哪张表的

ecbc966c836ebd76b88e6faa4f5c8523.png

Type列

type显示的是访问类型,是较为重要的一个指标,结果值从最好到最坏依次是:

system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL

需要记忆的

system>const>eq_ref>ref>range>index>ALL

一般来说,得保证查询至少达到range级别,最好能达到ref。

System与const

System:表只有一行记录(等于系统表),这是const类型的特列,平时不会出现,这个也可以忽略不计

Const:表示通过索引一次就找到了

const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快

如将主键置于where列表中,MySQL就能将该查询转换为一个常量

0fd14e9658568d40103e8d93b31c05f9.png

eq_ref

唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于主键或唯一索引扫描

f9ea6d7aa275ba6149e343fe81b1a459.png

Ref

非唯一性索引扫描,返回匹配某个单独值的所有行.

本质上也是一种索引访问,它返回所有匹配某个单独值的行,然而,它可能会找到多个符合条件的行,所以他应该属于查找和扫描的混合体

16f32001a5c891425f411e7ea9429b2e.png

Range

只检索给定范围的行,使用一个索引来选择行。key 列显示使用了哪个索引

一般就是在你的where语句中出现了between、、in等的查询

这种范围扫描索引扫描比全表扫描要好,因为它只需要开始于索引的某一点,而结束语另一点,不用扫描全部索引。

35d4de402d513c7af794ceef5f6e04ff.png

Index

当查询的结果全为索引列的时候,虽然也是全部扫描,但是只查询的索引库,而没有去查询数据。

726eab99b5b614467268275a7bb1734f.png

All

Full Table Scan,将遍历全表以找到匹配的行

80eb6d5b8fd27daf591ae66a9834060e.png

possible_keys 与Key

possible_keys:可能使用的key

Key:实际使用的索引。如果为NULL,则没有使用索引

查询中若使用了覆盖索引,则该索引和查询的select字段重叠

46fefcd4c4c330235d1add31f99c4306.png

key_len列

Key_len表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好

key_len显示的值为索引字段的最大可能长度,并非实际使用长度,即key_len是根据表定义计算而得,不是通过表内检索出的

faa181a75b26b6a6dc66ff112480f057.png

key_len表示索引使用的字节数,

根据这个值,就可以判断索引使用情况,特别是在组合索引的时候,判断所有的索引字段是否都被查询用到。

char和varchar跟字符编码也有密切的联系,

latin1占用1个字节,gbk占用2个字节,utf8占用3个字节。(不同字符编码占用的存储空间不同)

75c080235af3a37d86c86d206fb57819.png

字符类型

bd5091ef8da6226d924e421bca4a8930.png

字符类型-索引字段为char类型+不可为Null时

67d536625917a77bfded09df05b0592f.png

name这一列为char(10),字符集为utf-8占用3个字节Keylen=10*3

字符类型-索引字段为char类型+允许为Null时

69dbb6e4b746388c335dc71fe6296a35.png

name这一列为char(10),字符集为utf-8占用3个字节,外加需要存入一个null值

Keylen=10*3+1(null) 结果为31

索引字段为varchar类型+不可为Null时

50754d7e691b0dce03234e5ad2304f4a.png

Keylen=varchar(n)变长字段+不允许Null=n*(utf8=3,gbk=2,latin1=1)+2

索引字段为varchar类型+允许为Null时

bdb2419461dd5f479bc90ba6a6bde4e1.png

Keylen=varchar(n)变长字段+允许Null=n*(utf8=3,gbk=2,latin1=1)+1(NULL)+2

总结

字符类型

变长字段需要额外的2个字节(VARCHAR值保存时只保存需要的字符数,另加一个字节来记录长度(如果列声明的长度超过255,则使用两个字节),所以VARCAHR索引长度计算时候要加2),固定长度字段不需要额外的字节。

而NULL都需要1个字节的额外空间,所以索引字段最好不要为NULL,因为NULL让统计更加复杂并且需要额外的存储空间。

复合索引有最左前缀的特性,如果复合索引能全部使用上,则是复合索引字段的索引长度之和,这也可以用来判定复合索引是否部分使用,还是全部使用。

整数/浮点数/时间类型的索引长度

NOT NULL=字段本身的字段长度

NULL=字段本身的字段长度+1(因为需要有是否为空的标记,这个标记需要占用1个字节)

datetime类型在5.6中字段长度是5个字节,datetime类型在5.5中字段长度是8个字节

Ref列

显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值

54313496bf4c4538ebc7e3d096c7e099.png

由key_len可知t1表的idx_col1_col2被充分使用,col1匹配t2表的col1,col2匹配了一个常量,即 'ac'

其中 【shared.t2.col1】 为 【数据库.表.列】

Rows列

根据表统计信息及索引选用情况,大致估算出找到所需的记录所需要读取的行数

c7a1d60a2a892418155f9e91f28588fd.png

Extra列

包含不适合在其他列中显示但十分重要的额外信息。

55d64e878426a2392682551f04beb5af.png

Using filesort

说明mysql会对数据使用一个外部的索引排序,而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序”

当发现有Using filesort 后,实际上就是发现了可以优化的地方

9651828d99f4b7853027371ef29f70a4.png

上图其实是一种索引失效的情况,后面会讲,可以看出查询中用到了个联合索引,索引分别为col1,col2,col3

64148ac5ac62fdd0329d8d92abe6e0cb.png

当我排序新增了个col2,发现using filesort 就没有了。

Using temporary

使了用临时表保存中间结果,MySQL在对查询结果排序时使用临时表。常见于排序 order by 和分组查询 group by。

a3d1ad000f6a92720adec1486ba2c301.png

3872485811db013350fd059b3432f4e8.png

尤其发现在执行计划里面有using filesort而且还有Using temporary的时候,特别需要注意

Using index

表示相应的select操作中使用了覆盖索引(Covering Index),避免访问了表的数据行,效率不错!

如果同时出现using where,表明索引被用来执行索引键值的查找;

4089ae69b73d60a1d18bfce8a2655878.png

如果没有同时出现using where,表明索引用来读取数据而非执行查找动作

3f17adaac57b6c76dbce3e7ed170b1e0.png

Using where 与 using join buffer

Using where

表明使用了where过滤

using join buffer

使用了连接缓存:

a2b0c07e1f448f2bf3eb21adcdd9e4ad.png

impossible where

where子句的值总是false,不能用来获取任何元组

bfcfafc1a9b9bc54fec53a1c1de89dcc.png

filtered列

使用explain extended时显示,显示针对表里符合某个条件(where子句或者联结条件)的记录数的百分比所做的一个悲观估算,即mysql将要过滤行数的百分比。

sql优化顺口溜

全职匹配我最爱,最左前缀要遵守;

带头大哥不能死,中间兄弟不能断;

索引列上少计算,范围之后全失效;

LIKE百分写最右,覆盖索引不写*;

全职匹配我最爱?

a928249a6e1162d24a298ccfb1f3f19a.png

当建立了索引列后,能在where条件中使用索引的尽量所用。

最左前缀要遵守,带头大哥不能死,中间兄弟不能断?

458fd698b04fc2f1ef957d8445586d4c.png

如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中的列。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值