在实际开发工作中,难免会使用到 MySQL 的 count(expr) 函数进行统计操作,但是,对于count(1)、count(*)、count(常量)、count(主键)、count(非主键)、count(distinct(字段)) 等多个函数,很多开发人员因为缺乏原理性的了解,往往会比较困惑选择哪一种,特别是在加 where 条件时,更加担心会不会造成性能问题,今天我们就来聊聊这些 count(expr) 函数背后的实现原理以及它们的执行效率,帮你胸有成竹的选择合适具体函数。
申明:本文基于 MySQL 8.0.30,数据库引擎为 InnoDB引擎 和 MyISAM引擎;
本文的count(expr)操作都是基于不加 where条件
如果需要mac本地安装 MySQL,参考:macOS M1 源码安装 MySQL8 版本
背景
count(expr) 是 MySQL 的一个聚合函数,函数接收一个 expr 表达式,expr 表达式可以是 NULL、可以是列名,可以是常量,其他任意表达式都可以,它有 2个重要的作用:统计某个列值的数量以及统计表行数。在统计列数量时只统计列值不为 NULL 的总数,统计表总行数时不做限制。 为了更好地展开本文的讲解,需要先创建 user 和 person 两张表,user 表使用 InnoDB 引擎,person 表使用 MyISAM 引擎,表创建完成后,查看它们在磁盘上的文件信息对比,具体对比如下截图:
从上述截图可以看出:
在使用 MyISAM引擎的 person表中,表定义,数据,索引是分三个文件存储,如下:
- person_365.sdi,存储 person表定义,sdi(Serialized Dictionary Information,序列化字典信息),MySQL 8.0引入,以前的版本是 .frm;
- person.MYD,存储 person表数据,MYD(MyISAM Data);
- person.MYI,存储 person表索引,MYI(MyISAM Index);
在使用 InnoDB引擎的 user表中,表定义,数据,索引都存放在一个文件中,如下:
- user.ibd,ibd(innodb data)
接下来正式分析各个count(expr)操作
count(*)
对于 MyISAM 引擎,会把表的总行数存在了磁盘上(存放在 information_schema 库中的 PARTITIONS 表中),在不加 where 条件时,执行 count( ) 时会直接返回这个总数,因此效率很高,但是在加 where 限定语句的时候 MySQL 需要对全表进行检索从而得出 count 的总数。 而 InnoDB 引擎并没有像 MyISAM 那样把表的总行数存储在磁盘,