COUNT()是一个特殊的函数,有两种非常不同的作用:它可以统计某个列值的数量,也可以统计行数。
介绍
count(*)
忽略所有的列而直接统计所有的行数,在统计结果时不会忽略为 NULL 的值。
count(字段)
在统计结果时忽略列值为 NULL 的计数,即某个字段值为 NULL 时不统计。
count(1)
在统计结果时忽略所有列,用1代表行,包含为 NULL 值的记录。
count(1) VS count(*)
从执行计划来看 count(1) 和 count(*) 的效果是一样的。在有聚集索引时 count(1) 和 count(*) 基本没有差别!
执行效率
- 列名为主键,则 count(列名) 会比 count(1) 快
- 列名不为主键,则 count(1) 会比 count(列名) 快
- 如果表多个列并且没有主键,则 count(1)的执行效率优于 count(*)
- 如果有主键,则 select count(主键) 的执行效率是最优
- 如果表只有一个字段,则 select count(*) 最优
通常来说,COUNT() 都需要扫描大量的行(意味着要访问大量数据)才能获得精确的结果,因此是很难优化的。
在 MySQL 层面能做的基本只有索引覆盖扫描了。如果这还不够,就需要考虑修改应用的架构,可以用估算值取代精确值,也可以增加汇总表,或者增加类似 Redis 这样的外部缓存系统。