MYSQL count(*)这么慢，我该怎么办？极客时间MYSQL笔记

最新推荐文章于 2024-08-14 02:20:23 发布

simuLeo

最新推荐文章于 2024-08-14 02:20:23 发布

阅读量724

点赞数

分类专栏：数据库文章标签： mysql

本文链接：https://blog.csdn.net/simuLeo/article/details/104511224

版权

7 篇文章 0 订阅

订阅专栏

因为MVCC(并发版本控制)，不同的会话查同一个表的总行数，要保证可重复读隔离级别的总行数数据正确性，只能一行行地读出来累加;
InnoDB对COUNT(*)也是做了优化的，InnoDB 是索引组织表，主键索引树的叶子节点是数据，而普通索引树的叶子节点是主键值。所以，普通索引树比主键索引树小很多。对于 count(*) 这样的操作，遍历哪个索引树得到的结果逻辑上都是一样的。因此，MySQL 优化器会找到最小的那棵树来遍历。在保证逻辑正确的前提下，尽量减少扫描的数据量，是数据库系统设计的通用法则之一。
索引统计的值不能用来做表的总行数，**索引统计的值是通过采样来估算的。**实际上，**TABLE_ROWS 就是从这个采样估算得来的，因此它也很不准。**有多不准呢，官方文档说误差可能达到 40% 到 50%。所以，show table status 命令显示的行数也不能直接使用。

小结一下：

首先我们考虑的肯定是缓存系统，但是缓存系统redis或memcache这些数据库和mysql不是同一个系统，很难保证数据一致性:
1. 一种是，查到的 100 行结果里面有最新插入记录，而 Redis 的计数里还没加 1；
2. 另一种是，查到的 100 行结果里没有最新插入的记录，而 Redis 的计数里已经加了 1。这两种情况，都是逻辑不一致的。
既然MVCC能保证数据的一致性，那么我们就用一张计数表专门进行表的行数统计，用事务来包裹住行的新增和计数表的计数增加，这样就能保证数据的一致性。