mysql count(*) 真的慢吗？

标标王者

已于 2023-11-16 17:13:09 修改

阅读量186

点赞数 4

分类专栏： mysql 文章标签： mysql 数据库

于 2023-11-16 14:16:29 首次发布

本文链接：https://blog.csdn.net/ch568/article/details/134435274

版权

mysql 专栏收录该内容

7 篇文章 1 订阅

订阅专栏

在开发系统的时候，可能经常需要计算一个表的行数，比如一个订单表的所有订单总数。
通常我们都是 select count(*) from t 解决
但是，慢慢我们会发现，随着我们系统的记录行数，表中的数据越来越多，这条语句的执行时间也会越来越长

count(*) 的实现方式

首先在MySQL 引擎中，count(*) 有不同的实现方式

MyISAM 引擎把一个表的总行数存在了磁盘上，因此执行 count(*) 的时候会直接返回这个数，
效率很高；
而 InnoDB 引擎就麻烦了，它执行 count(*) 的时候，需要把数据一行一行地从引擎里面读出来，
然后累积计数。

不过，这里需要注意的是这些都是没有加过滤条件的 count(*) 实现方式，
如果加了 where 条件的话，MyISAM 也是不能直接返回的

为什么 InnoDB 不跟 MyISAM 一样，也把数字存起来呢？

这是因为即使是在同一个时刻的多个查询，由于多版本并发控制（MVCC）的原因，InnoDB 表“应该返回多少行”也是不确定的。

这里用一个例子来解释一下

假设表 t 中现在有 10000 条记录，我们设计了三个用户并行的会话。

会话 A 先启动事务并查询一次表的总行数；
会话 B 启动事务，插入一行后记录后，查询表的总行数；
会话 C 先启动一个单独的语句，插入一行记录后，查询表的总行数。

我们假设从上到下是按照时间顺序执行的，同一行语句是在同一时刻执行的。
在这里插入图片描述

你会看到，在最后一个时刻，三个会话 A、B、C 会同时查询表 t 的总行数，但拿到的结果却不同。
这和 InnoDB 的事务设计有关系，可重复读是它默认的隔离级别，在代码上就是通过多版本并发控制，也就是 MVCC 来实现的。每一行记录都要判断自己是否对这个会话可见，因此对于 count(*) 请求来说，InnoDB 只好把数据一行一行地读出依次判断，可见的行才能够用于计算“基于这个查询”的表的总行数。

当然，现在这个看上去笨笨的 MySQL，在执行 count() 操作的时候还是做了优化的。
你知道的，InnoDB 是索引组织表，主键索引树的叶子节点是数据，
而普通索引树的叶子节点是主键值。所以，
普通索引树比主键索引树小很多。对于 count() 这样的操作，
遍历哪个索引树得到的结果逻辑上都是一样的。
因此，MySQL 优化器会找到最小的那棵树来遍历。
在保证逻辑正确的前提下，尽量减少扫描的数据量，是数据库系统设计的通用法则之一。