计算表记录总量最直接的方法就是使用count()
比如:select count(*) from 表名;
也有人喜欢这么写:
select count(字段名) from 表名;
这两种写法都可以得到结果,不过效果略有不同。
count(*)一定返回的是表记录总量
count(字段名)返回的是该字段不为null值的记录总量。它有可能跟count(*)相等,也可能不等。
所以要慎用count(字段名)这种写法。
在表记录较多的情况,count(*)执行时间会较长。例如我公司有一张表内数据1亿条,执行时间47秒。
在生产环境这非常可怕。因为这一慢查询的执行,可能引起其他sql的效率低下,有可能引起链式反应像核爆炸那样耗尽服务器资源。
我们尽量要在生产环境避免这类语句执行。如果一定要,那么在满足一定条件下可以使用下面的小技巧来优化。
第一个条件是该表拥有自增长字段,并定义为主键。
第二个条件是该表不删除记录或只从头部删除数据。即保持表内记录的连续性。
满足以上条件,我们就可以使用下面的语句来替代count(*)
select (max(id)-min(id)+1) as total from 表名;
注:id是自增长字段,且是主键
如果确定一定不会删除数据,也可以简化为如下:
select max(id) as total from 表名;
这个优化利用了自增长字段的特性来实现count()等效的统计效果。
实际效果1亿条记录,统计时间为57ms。
如果需要使用where缩减范围,只要不破坏数据连续性的条件也可以使用这个方法优化。
比如id大于或小于某个值,创建记录时间大于或小于某个时间点等等。