count(*) 这么慢，我该怎么办？

最新推荐文章于 2023-11-22 17:26:50 发布

发飙的蜗牛咻咻咻~

最新推荐文章于 2023-11-22 17:26:50 发布

阅读量342

点赞数 3

分类专栏： ★ MySQL 实战文章标签： MySQL 统计 count

huadong

本文链接：https://blog.csdn.net/qq_36221788/article/details/103445980

版权

★ MySQL 实战专栏收录该内容

24 篇文章 1 订阅

订阅专栏

文章目录

count(*) 不同的实现方式
到底该如何计数？
不同的 count 用法

count(*) 不同的实现方式

首先要明确的是，在不同的 MySQL 引擎中，count(*) 有不同的实现方式。
- MyISAM 引擎把一个表的总行数存在了磁盘上，因此执行 count(*) 的时候会直接返回这个数，效率很高；
- InnoDB 引擎就麻烦了，它执行 count(*) 的时候，需要把数据一行一行地从引擎里面读出来，然后累积计数。
- 这里讨论的是没有过滤条件的 count(*)，如果加了 where 条件的话，MyISAM 表也是不能返回得这么快的。
count(*) 统计原理： InnoDB 是索引组织表，主键索引树的叶子节点是数据，而普通索引树的叶子节点是主键值。所以，普通索引树比主键索引树小很多。对于 count(*) 这样的操作，遍历哪个索引树得到的结果逻辑上都是一样的。因此，MySQL 优化器会找到最小的那棵树来遍历。在保证逻辑正确的前提下，尽量减少扫描的数据量，是数据库系统设计的通用法则之一。
实现方式小结
- MyISAM 表虽然 count(*) 很快，但是不支持事务；
- show table status 命令虽然返回很快，但是不准确，只是个估算的值；
- InnoDB 表直接 count(*) 会遍历全表，虽然结果准确，但会导致性能问题。

到底该如何计数？

如果你现在有一个页面经常要显示交易系统的操作记录总数，到底应该怎么办呢？

用缓存系统保存计数：用 Redis 服务来计数，每次进行插入或者删除的操作时，Redis 就会进行加一或者减一的操作，但是这样会出现缓存系统丢失更新的现象。比如刚刚在数据库表中插入了一行，Redis 中保存的值也加一，然后 Redis 异常重启，重启后你要从存储 Redis 数据的地方把这个值读回来，而刚刚加一的这个计数操作却丢失了。当然假如 Redis 计数正常工作，这个值还是逻辑上不精确地，例如：
- 一种是，查到的 100 行结果里面有最新插入记录，而 Redis 的计数里还没加 1；
- 另一种是，查到的 100 行结果里没有最新插入的记录，而 Redis 的计数里已经加了 1。
在数据库保存计数：利用“事务”这个特性，解决了使用 Redis 计数逻辑上不精确的问题。

不同的 count 用法

count(*)、count(主键 id)、count(1) 和 count(字段) ，究竟哪个更快？

结果集差别
- 首先要弄清楚 count() 的语义。count() 是一个聚合函数，对于返回的结果集，一行行地判断，如果 count 函数的参数不是 NULL，累计值就加 1，否则不加。
- 所以，count(*)、count(主键 id) 和 count(1)都表示返回满足条件的结果集的总行数；而 count(字段），则表示返回满足条件的数据行里面，参数“字段”不为 NULL 的总个数。
查询性能差别
- 对于 count(主键 id) 来说，InnoDB 引擎会遍历整张表，把每一行的 id 值都取出来，返回给 server 层，server 层拿到 id 后，判断是不可能为空的，就按行累加。
- 对于 count(1) 来说，InnoDB 引擎遍历整张表，但不取值。server 层对于返回的每一行，放一个数字“1”进去，判断是不可能为空的，按行累加。这个方式要比 count(主键 id) 快，因为从引擎返回 id 会涉及到解析数据行，以及拷贝字段值的操作。
- 对于 count(字段) 来说：
  - 如果这个“字段”是定义为 not null 的话，一行行地从记录里面读出这个字段，判断不能为 null，按行累加；
  - 如果这个“字段”定义允许为 null，那么执行的时候，判断到有可能是 null，还要把值取出来再判断一下，不是 null 才累加。
- count(*) 是例外，并不会把全部字段取出来，而是专门做了优化，不取值，count(*) 肯定不是 null，直接按行累加。
- 所以结论是：count(字段) < count(主键 id) < count(1) ≈ count(*)