COUNT是一个汇总函数(聚集函数),它接收1个表达式作为参数:
COUNT(expr)
复制代码
COUNT函数用于统计在符合搜索条件的记录中,指定的表达式expr
不为NULL的行数有多少。这里需要特别注意的是,expr
不仅仅可以是列名,其他任意表达式都是可以的。
比方说:
SELECT COUNT(key1) FROM t;
复制代码
这个语句是用于统计在single_table表的所有记录中,key1列不为NULL的行数是多少。
再看这个:
SELECT COUNT(‘abc’) FROM t;
复制代码
这个语句是用于统计在single_table表的所有记录中,'abc’这个表达式不为NULL的行数是多少。很显然,'abc’这个表达式永远不是NULL,所以上述语句其实就是统计single_table表里有多少条记录。
再看这个:
SELECT COUNT(*) FROM t;
复制代码
这个语句就是直接统计single_table表有多少条记录。
总结+注意:COUNT函数的参数可以是任意表达式,该函数用于统计在符合搜索条件的记录中,指定的表达式不为NULL的行数有多少。
MySQL中COUNT是怎样执行的
做了那么多铺垫,终于到了MySQL中COUNT是怎样执行的了。
以下边这个语句为例:
SELECT COUNT(*) FROM t;
复制代码
这个语句是要去查询表t中共包含多少条记录。由于聚簇索引和二级索引中的记录是一一对应的,而二级索引记录中包含的列是少于聚簇索引记录的,所以同样数量的二级索引记录可以比聚簇索引记录占用更少的存储空间。如果我们使用二级索引执行上述查询,即数一下idx_key1中共有多少条二级索引记录,是比直接数聚簇索引中共有多少聚簇索引记录可以节省很多I/O成本。所以优化器会决定使用idx_key1执行上述查询:
mysql> EXPLAIN SELECT COUNT(*) FROM t;
±—±------------±------±-----------±------±--------------±---------±--------±-----±-----±---------±------------+
| id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
±—±------------±------±-----------±------±--------------±---------±--------±-----±-----±---------±------------+
| 1 | SIMPLE | t | NULL | index | NULL | idx_key1 | 5 | NULL | 16 | 100.00 | Using index |
±—±------------±------±-----------±------±--------------±---------±--------±-----±-----±---------±------------+
1 row in set, 1 warning (0.02 sec)
复制代码
在执行上述查询时,server层会维护一个名叫count的变量,然后:
-
server层向InnoDB要第一条记录。
-
InnoDB找到idx_key1的第一条二级索引记录,并返回给server层(注意:由于此时只是统计记录数量,所以并不需要回表)。
-
由于COUNT函数的参数是
*
,MySQL会将*
当作常数0处理。由于0并不是NULLÿ