count(?)为什么越来越慢？

最新推荐文章于 2024-07-08 21:32:26 发布

一零贰肆

最新推荐文章于 2024-07-08 21:32:26 发布

阅读量419

点赞数

文章标签：数据库

本文链接：https://blog.csdn.net/m0_56287495/article/details/137679726

版权

在日常的业务开发中，汇总记录使用select count(*) from t是常见用法，分页查询的时候都会用到，那么随着系统记录的数量越来越多，你有没有发现这条语句执行的也越来越慢了呢？

一、count(*)原理

在不同的存储引擎中，count(*)有不同的实现方式

MyISAM 存储引擎中，把一个表的总行数存在了磁盘上，因此执行 count(*)的时候，直接读取这个值就行了，效率很高
而 InnoDB 执行 count(*)的时候，需要把一行一行数据从存储引擎里读取出来，然后累计计数

当然我们讨论的是没有带 where 语句的，如果带了 where 语句，MyISAM 返回的也不会这么快的

那么问题来了，为什么 InnoDB 不能想 MyISAM 一样，把总数存储起来，而要一行一行的读呢？

原因就是InnoDB是支持事务的，由于多版本并发控制(MVCC)的原因,InnoDB在不同时刻调用count(*)的数据是不确定的

这里举个例子，假设 T 表中有 10000 条数据，设计三个会话：

sessionA	sessionB	sessionB
select count(*) from t； (返回 10000)
		insert into t (插入一行)
	insert into t(插入一行)
select count(*) from t;(返回 10000)	select count(*) from t;(返回 10002)	select count(*) from t;(返回 10001)

可以看出不同时期的 count()返回的值是不一样的，每一行记录都要判断自己是否对这个会话可见，因此对 count()来说，InnoDB 只有把每一行都读出来做判断，可见性行的才能用于计算总行数

那么 InooDB 是怎么统计记录的呢？

InnoDB 是索引组织表，主键索引树的叶子节点存放的是数据，而普通索引的叶子节点存放的是主键值。所以这就导致了普通索引是比主键索引小很多的，对于 count(*)来说，遍历哪一个索引树在结果逻辑上都是一样的，因此MySQL优化器会找到最小的那一颗索引树来遍历，在保证逻辑结果正确的前提下，尽量减少扫描的数据量，是数据库系统设计的通用法则之一