MySQL统计总行数:听说count(*)性能更好,是真的吗

在日常的开发工作中,统计一张表的总行数是一个很常见的需求。通常我们会使用这样一条sql查询数据:select count(*) from table t。但是,随着表中的数据越来越多,这条sql的执行速度也会越来越慢。

今天我们就来聊一聊,count(*)是如何统计一张表中的总行数的,以及count(*)、count(1)、count(id)、count(字段)这几种方式的性能差异。

count(*)的执行方式

首先,根据官方的描述,使用不同的执行引擎,count(*)的实现方式是有区别的。

在MyISAM引擎中,表的总行数是直接存在磁盘上,所以查询的时候可以直接返回,效率很高。

但是对于InnoDB引擎来说,情况就不一样了。由于多版本并发控制MVCC的存在,InnoDB在执行count(*)时,无法确定表中到底有多少行,只好把数据一行一行的从引擎中读出来,然后累加计数。

那InnoDB为什么要这么麻烦呢?为什么不像MyISAM那样,把总行数存在磁盘上呢?

这是因为在同一时刻,可能存在多个事务查询,因为MVCC的原因,不同事务是相互隔离的,InnoDB需要在当前事务中,一行一行的读取数据,然后判断哪些数据对自己是可见的,哪些数据对自己是不可见的。

所以随着表中数据越来越多,我们会发现count(*)的速度也会越来越慢了。

不同count用法的差异

首先我们要清楚,count是一个聚合函数,对查到的结果集,会一行一行的判断,如果不为NULL,累计值就加1,最终得到一个值。

1,对于count(主键id)来说,InnoDB引擎遍历表中的每一行,将主键id获取到以后返回给Server层,Server层判断id不为null,然后进行累加。(ps.主键id肯定是不为空的,正常来说是不需要判断的,但是官方源码中确实有这个判断)

2,对于count(1)来说,InnoDB依然遍历表中的每一行,但是并不获取值(返回一行,不取字段),Server对于返回的数据,直接放一个“1”进去,然后判断不为null,进行累加。

3,对于count(字段)来说,遍历表中的每一行,读出这个字段,Server层判断是否为null,如果不为null,则进行累加,如果为null,就忽略这一行。

4,对于count(*)来说,MySQL专门做了优化,就像count(1)那样,并不取值,count(*)肯定不是null,直接按行累加。

由于count(*)并不需要对获取的值进行null判断,所以性能理论上会比count(1)更好一点。但是一般认为这点影响微乎其微,并没有什么实际性差异。

这一点在MySQL官方文档上也有说明:

InnoDB handles SELECT COUNT(*) and SELECT COUNT(1) operations in the same way. There is no performance difference。

总结

按照执行效率来说:count(字段)<count(主键id)<count(1)≈count(*)。

一般情况下,count(*)是更好的选择。

写文不易,朋友们点赞关注支持一下吧。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员拾山

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值