当我们查询一张数据量很大的表时,使用SQL:
select count(*) from t1;
这条SQL非常耗时。那么当执行count(*)的时候发生了什么呢?
1. count(a)和count(*)的区别?
- 当count()统计某一列时,比如count(a),是根据a列来统计表的记录数,是不统计null的;
- 当count(*)时,无论是否包含null,都会被统计;
- 因此如果想知道结果集的行数,应该使用count(*);
2. count(1)比count(*)更快吗?
- 因为count(1)是恒真表达式,因此也会统计结果集的行数,所以两者在统计结果数上是相同的;
- 如果想比较快慢,可以通过SQL执行计划来分析:
count(1)的SQL执行计划如下:
count(*)的SQL执行计划如下:
两者执行计划相同,所以速度相同。
3. 用Redis作为计数器来提高count效率
首先初始化时,执行一次精确的计数:
select count(*) from t1;
然后,把结果存在redis中:
set t1_count 10000
当t1写入一条数据时,同时将redis计数器+1:
incr t1_count
当t1删除一条数据时,同时将redis计数器-1:
decr t1_count
但是对mysql增删的操作和对redis增删的操作一定要在同一个事务中,保证原子性。
当需要查询数据集的行数时,只需要去redis中去查即可:
get t1_count