【转】一条SQL语句执行得很慢的原因有哪些?

转自:
https://mp.weixin.qq.com/s/YKmFEtHcZPBn1S9so0kxYw

大多数情况下是正常的,只是偶尔会出现很慢的情况

  • 数据库在刷新脏页

当我们要往数据库中插入一条数据或者更新一条数据时,数据库会先在内存中把对应字段的数据更新了。但是更新完毕之后,这些更新的字段并不会马上同步持久化到磁盘中去,而是会先把这些更新的记录写入到 redo log 日志中,等到空闲的时候才会通过 redo log 里的日志把最新的数据同步到磁盘里。

但 redo log 的容量是有限的,如果数据库一直很忙并且更新又很频繁,那么 redo log 很快就会被写满,从而没办法等到空闲时再把数据同步到磁盘,只能暂停其他操作,全身心地来把数据同步到磁盘中去,造成的现象就是我们平时正常的 SQL 语句突然会执行得很慢。

也就是说,数据库在同步数据到磁盘的时候,有可能会导致我们的 SQL 语句执行得很慢。

  • 无法获取锁资源或者执行的时候遇到了表锁或行锁

如果我们要执行的 SQL 语句,其涉及到的表正好别人也在用并且加锁了,或者表并没有被加锁但是要使用到的某一行被加锁了,那么我们便无法获取锁,只能慢慢等待别人释放锁了。

如果要判断是否真的在等待锁资源,可以使用 show processlist 命令来查看当前的状态。

在数据量基本不变的情况下,这条 SQL 语句一直以来都执行得很慢

  • 没有用上索引或者字段没有索引或者字段有索引但是没有使用索引
select * from table where count - 1 = 100;

当我们在查询的时候如果对字段进行了函数操作,也是会导致索引失效的。

  • 数据库选错了索引
select * from table where 100 < count and count < 10000;

我们知道,主键索引和非主键索引是有区别的,主键索引里存放的值是整行字段的数据,而非主键索引里存放的值是主键字段的值。

也就是说,当我们走 count 字段的索引时,最后会查询到对应的主键的值,然后再根据主键值走主键索引,查询到整行数据后再返回。

但在有些时候,即使你在 count 字段上设置了索引,系统也不一定会走 count 字段上的索引,而是有可能会直接走全表查询,找出所有符合条件的数据。

这是因为系统在执行这条语句的时候,会进行预测:究竟是走 count 索引扫描的行数少,还是直接走全表扫描的行数少?

显然扫描的行数越少越好,因为扫描的行数越少,意味着磁盘 I/O 操作次数就越少。

如果是走全表扫描,那么扫描的次数就是这个表的总行数,假设为 n。而如果是走索引 count,我们通过索引 count 找到主键之后,还得再通过主键索引来找到我们整行的数据,也就是说需要走两次索引。

而且我们也不知道符合条件的数据到底有多少行,万一这个表全部的数据都符合呢?这个时候就意味着走 count 索引不仅扫描的行数是 n,而且同时还得每行数据都走两次索引。

所以,系统是有可能走全表扫描而不走索引的。

这主要来源于系统的预测,也就是说,如果要走 count 字段索引的话,系统会预测走 count 字段索引大概需要扫描多少行。如果预测到要扫描的行数很多,那么它可能就不走索引而直接扫描全表了。

那么问题来了,系统是怎么预测判断的呢?

答案是,系统是通过索引的区分度来进行判断的,一个索引上不同的值越多,就意味着出现相同数值的索引越少,即索引的区分度就越高(区分度也称之为基数),区分度越高,基数越大。

所以,基数越大,就意味着符合条件的行数越少,意味着走索引查询就越有优势。

系统当然是不会遍历全部数据来获得一个索引的基数的,这样代价太大了。系统是通过遍历部分数据,也就是通过采样的方式,来预测索引的基数。

既然是采样,那么就有可能会出现失误的情况,也就是说,count 这个索引的基数实际上是很大的,但是在采样的时候,却很不幸地把这个索引的基数预测得很小。例如采样的那一部分数据刚好基数很小,然后系统就误以为是索引的基数很小,从而导致系统就不走 count 索引而改为直接走全表扫描了。

由于统计的失误,导致系统没有走索引,而是走了全表扫描,这也是导致我们 SQL 语句执行得很慢的原因之一。系统判断是否走索引,扫描行数的预测其实只是影响因素之一,这条查询语句是否需要使用到临时表、是否需要排序等因素也是会影响到系统的选择的。

我们有时候也可以通过强制走索引的方式来查询。

select * from table force index(a) where 100 < count and count < 10000;

我们也可以通过命令 show index from table 来查询索引的基数是否和实际相符合,如果和实际很不符的话,可以使用命令 analyze table t 来重新统计分析索引的基数。

另外,既然系统会预测错索引的基数,这也意味着当我们的查询语句有多个索引的时候,系统也有可能会选错索引,这也可能是 SQL 语句执行得很慢的一个原因。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值