count(*) count(1) 的效率问题

最新推荐文章于 2024-06-24 16:22:22 发布

香菜纸

最新推荐文章于 2024-06-24 16:22:22 发布

阅读量258

点赞数

文章标签： mysql 数据库

本文链接：https://blog.csdn.net/m0_54115614/article/details/130115649

版权

1.不同count的原理说明

count统计的时候我们要区分是否为null，这就有两种统计方式：不管是否为null，只要存在这行记录就+1；如果为null，该记录就不纳进统计，因此是否判断为null会影响到计数的准确性和速度(相当于每一行都不判断，当百万行、千万行时效率提升明显)，所以：

count(*):不做判断，取一行，server就+1(MySQL做了优化)
count(1):不做判断，去一行，server就+1(因为是true，所以只要有就+1)

2.count(*)与count(1)效率

在MySQL InnoDB存储引擎中，COUNT(*)和COUNT(1)都是对的所有结果进行的COUNT。如果有WHERE子句，则是对所有符合筛选条件的数据行进行统计。如果没有WHERE子句，则是对数据表的数据行数进行统计。因此COUNT(*)和COUNT(1)本质上没有区别，执行的复杂度都是O(N)，也就是采用全表扫描，进行循环+计数的方式进行统计。

如果是MySQL MyISAM存储引擎，统计数据表的行数只需要O(1)复杂度，这是因为每张MyISAM的数据表都有一个meta信息有存储了row_count值。而一致性由表级锁来保证。而InnoDB支持事务，采用行级锁和MVCC机制，所以无法像MyISAM一样，只维护一个row_count变量。因此就需要采用扫描全表，进行循环+计数的方式来完成统计。

需要注意的是，在实际执行中COUNT(*)和COUNT(1)执行时间可能略有差别，不过你还是可以把这两个在执行效率上看成是相等的。另外在InnoDB引擎中，如果是采用COUNT(*)和COUNT(1)来统计数据行数，要尽量采用二级索引。如果有多个二级索引的时候，会使用key_len小的二级索引进行扫描。当没有二级索引的时候，才会采用主键索引来进行统计。

所以：

1、一般情况下：COUNT(*) = COUNT(1) > COUNT(字段)

所以尽量使用COUNT(*)，因为COUNT(*)是标准写法，当然如果你要统计的是就是某个字段的非空数据行数，那另当别论。毕竟执行效率比较的前提是要结果一样才行。

2、如果要统计COUNT(*)，尽量在数据表上建立二级索引，系统会自动采用key_len小的二级索引进行扫描，这样当我们使用SELECT COUNT(*)的时候效率就会提升，有时候提升几倍甚至更高都是有可能的。

————————————————
参考原文链接：https://blog.csdn.net/pyzfirst/article/details/108521334