从以前的博客中总结中的count(*) 和count(id)的区别就是:count(*)查询的是总条数,count(id)查询的是id非null的条数。
再实际开发过程中,需要查询符合某个查询条件的总条数时,这两个有很大的查询效率区别;
我开发过程中遇到了一个表有200多万条数据,需要查询某个条件的总条数时,对于上述两个细节的选择会产生很大的查询效率差异。
表中有id,status,compiler_id,.....;status,compiler_id是建的(status,compiler_id)组合索引。
我需要查询status = 1 and compiler_id = 1的总条数时,使用count(id)会花15s左右,而count(*)只需要不到1s。
使用explain观察,结果如下:
count(*)的 Extra 是Using index;
Extra 的using index:出现这个说明mysql使用了覆盖索引,避免访问了表的数据行,效率不错!
这里就需要谈论到覆盖索引的问题了:覆盖索引是select的数据列只用从索引中就能够取得,不必读取数据行,换句话说查询列要被所建的索引覆盖。拿上述的查询来讲:查询count(*),我们只需要在我们建的索引树上就能统计总条数,而count(id)我们需要通过索引树拿到表的具体数据,过滤掉id为null的数据行,所以查询相当慢。
这里并不是说只有count(*)才能达到索引覆盖,上述例子中count(status)和count(compiler_id )都行,因为这两个都不用具体到表中的数据行就能统计出条数。
200万条数据情况下,将开发代码中将count(id)改为count(*)之后,查询时间快了10多s。