转自:
https://mp.weixin.qq.com/s/YKmFEtHcZPBn1S9so0kxYw
大多数情况下是正常的,只是偶尔会出现很慢的情况
- 数据库在刷新脏页
当我们要往数据库中插入一条数据或者更新一条数据时,数据库会先在内存中把对应字段的数据更新了。但是更新完毕之后,这些更新的字段并不会马上同步持久化到磁盘中去,而是会先把这些更新的记录写入到 redo log 日志中,等到空闲的时候才会通过 redo log 里的日志把最新的数据同步到磁盘里。
但 redo log 的容量是有限的,如果数据库一直很忙并且更新又很频繁,那么 redo log 很快就会被写满,从而没办法等到空闲时再把数据同步到磁盘,只能暂停其他操作,全身心地来把数据同步到磁盘中去,造成的现象就是我们平时正常的 SQL 语句突然会执行得很慢。
也就是说,数据库在同步数据到磁盘的时候,有可能会导致我们的 SQL 语句执行得很慢。
- 无法获取锁资源或者执行的时候遇到了表锁或行锁
如果我们要执行的 SQL 语句,其涉及到的表正好别人也在用并且加锁了,或者表并没有被加锁但是要使用到的某一行被加锁了,那么我们便无法获取锁,只能慢慢等待别人释放锁了。
如果要判断是否真的在等待锁资源,可以使用 show processlist 命令来查看当前的状态。
在数据量基本不变的情况下,这条 SQL 语句一直以来都执行得很慢
- 没有用上索引或者字段没有索引或者字段有索引但是没有使用索引
select * from table where count - 1 = 100;
当我们在查询的时候如果对字段进行了函数操作,也是会导致索引失效的。
- 数据库选错了索引
select * from table where 100 < count and count < 10000;
我们知道,主键索引和非主键索引是有区别的,主键索引里存放的值是整行字段的数据,而非主键索引里存放的值是主键字段的值。
也就是说,当我们走 count 字段的索引时,最后会查询到对应的主键的值,然后再根据主键值走主键索引,查询到整行数据后再返回。
但在有些时候,即使你在 count 字段上设置了索引,系统也不一定会走 count 字段上的索引,而是有可能会直接走全表查询,找出所有符合条件的数据。
这是因为系统在执行这条语句的时候,会进行预测:究竟是走 count 索引扫描的行数少,还是直接走全表扫描的行数少?
显然扫描的行数越少越好,因为扫描的行数越少,意味着磁盘 I/O 操作次数就越少。
如果是走全表扫描,那么扫描的次数就是这个表的总行数,假设为 n。而如果是走索引 count,我们通过索引 count 找到主键之后,还得再通过主键索引来找到我们整行的数据,也就是说需要走两次索引。
而且我们也不知道符合条件的数据到底有多少行,万一这个表全部的数据都符合呢?这个时候就意味着走 count 索引不仅扫描的行数是 n,而且同时还得每行数据都走两次索引。
所以,系统是有可能走全表扫描而不走索引的。
这主要来源于系统的预测,也就是说,如果要走 count 字段索引的话,系统会预测走 count 字段索引大概需要扫描多少行。如果预测到要扫描的行数很多,那么它可能就不走索引而直接扫描全表了。
那么问题来了,系统是怎么预测判断的呢?
答案是,系统是通过索引的区分度来进行判断的,一个索引上不同的值越多,就意味着出现相同数值的索引越少,即索引的区分度就越高(区分度也称之为基数),区分度越高,基数越大。
所以,基数越大,就意味着符合条件的行数越少,意味着走索引查询就越有优势。
系统当然是不会遍历全部数据来获得一个索引的基数的,这样代价太大了。系统是通过遍历部分数据,也就是通过采样的方式,来预测索引的基数。
既然是采样,那么就有可能会出现失误的情况,也就是说,count 这个索引的基数实际上是很大的,但是在采样的时候,却很不幸地把这个索引的基数预测得很小。例如采样的那一部分数据刚好基数很小,然后系统就误以为是索引的基数很小,从而导致系统就不走 count 索引而改为直接走全表扫描了。
由于统计的失误,导致系统没有走索引,而是走了全表扫描,这也是导致我们 SQL 语句执行得很慢的原因之一。系统判断是否走索引,扫描行数的预测其实只是影响因素之一,这条查询语句是否需要使用到临时表、是否需要排序等因素也是会影响到系统的选择的。
我们有时候也可以通过强制走索引的方式来查询。
select * from table force index(a) where 100 < count and count < 10000;
我们也可以通过命令 show index from table 来查询索引的基数是否和实际相符合,如果和实际很不符的话,可以使用命令 analyze table t 来重新统计分析索引的基数。
另外,既然系统会预测错索引的基数,这也意味着当我们的查询语句有多个索引的时候,系统也有可能会选错索引,这也可能是 SQL 语句执行得很慢的一个原因。