mysql count的原理_详解 MySQL中count函数的正确使用方法

3a2c5c47719654b2eb3ed26ac95e70d8.png

1. 描述

在MySQL中,当我们需要获取某张表中的总行数时,一般会选择使用下面的语句

select count(*) from table;

其实count函数中除了*还可以放其他参数,比如常数、主键id、字段,那么它们有什么区别?各自效率如何?我们应该使用哪种方式来获取表的行数呢?

当搞清楚count函数的运行原理后,相信上面几个问题的答案就会了然于胸。

2. 表结构

为了解决上述的问题,我创建了一张 user 表,它有两个字段:主键id和name,后者可以为null,建表语句如下。

CREATE TABLE `user` (

`id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主键',

`name` varchar(255) DEFAULT NULL COMMENT '姓名',

PRIMARY KEY (`id`)

) ENGINE=InnoDB DEFAULT CHARSET=utf8;

在该表中共有6000000条数据,前1000000条数据行的name字段为空,其余数据行name=id,使用存储过程造测试数据的代码如下

-- 使用存储过程造测试数据

delimiter;;

create procedure idata()

begin

declare i int;

set i=1;

while(i<=6000000)do

insert into user values(i, i);

set i=i+1;

end while;

end;;

delimiter;

call idata();

-- 将前1000000条数据的name字段置为null

update user set name=null where id<1000000;

3. 执行 SQL 语句及结果

为了区分count函数不同参数的区别,主要从执行时间和扫描行数这两方面来描述SQL的执行效率,同时还会从返回结果来描述`count函数的特性。

*符号 —— select count(*) from user;

常数—— select count(1) from user;

非空字段—— select count(id) from user;

可为空的字段—— select count(name) from user;

3.1 *符号

mysql> select count(*) from user;

+----------+

| count(*) |

+----------+

| 6000000 |

+----------+

1 row in set (0.76 sec)

遍历全表,不取值(优化后,必定不是null,不取值),累加计数,最终返回结果。

3.2 常数

mysql> select count(1) from user;

+----------+

| count(1) |

+----------+

| 6000000 |

+----------+

1 row in set (0.76 sec)

遍历全表,一行行取数据,将每一行赋值为1,判断到该字段不可为空,累加计数,最终返回结果。

3.3 非空字段

mysql> select count(id) from user;

+-----------+

| count(id) |

+-----------+

| 6000000 |

+-----------+

1 row in set (0.85 sec)

遍历全表,一行行取数据(会选择最小的索引树来遍历,所以比相同情况下的count字段效率更高),取每行的主键id,判断到该字段不可为空,累加计数,最终返回结果。

3.4 可为空的字段

mysql> select count(name) from user;

+-------------+

| count(name) |

+-------------+

| 5900001 |

+-------------+

1 row in set (0.93 sec)

若字段定义不为空:遍历全表,一行行取数据,取每行的该字段,判断到该字段不可为空,累加计数,最终返回结果。

若字段定义可为空:遍历全表,一行行取数据,取每行的该字段,判断到该字段可能是null,然后再判断该字段的值是否为null,不为null才累加计数,最终返回结果。

若该字段没有索引,将遍历主键索引树。

4. 执行结果分析

4.1 结果集

首先从结果集的角度来看,前三条 SQL 语句的目的是一样的——返回的是所有行数,而 count 函数的参数是普通字段且字段默认为 null的时候,它返回的是该字段不为 null 的行数。

4.2 执行时间

从执行时间上来看的话,效率大致是count(可为空的字段) < count(非空字段) < count(常数) < count(*)。

5. 总结

count是一个聚合函数,对于返回的结果集,一行行地判断,如果count函数的参数不是NULL,累计值就加1,否则不加。最后返回累计值。

count(*)速度最快的原因是它不会在计数的时候去取每行数据值

count(1)比count(*)稍慢的原因是它会取每个数据行并赋值为1

count(非空字段)比count(1)稍慢的原因是它会从每个数据行中取出主键 id

count(可为空的字段)最慢的原因是它可能需要判断每个数据行中的改字段是否为 null

所以,最好还是用count(*)。

以上就是详解 MySQL中count函数的正确使用方法的详细内容,更多关于MySQL count函数的资料请关注其它相关文章!

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值