这里讨论的是在sql中,我们在查询数据时,需要分组同时有2个以上筛选条件的时候,是只用having,还是使用having和where组合使用的写法进行探讨。
首先,给一下sql查询语句的程序运行顺序:
(5) SELECT [DISTINCT] 分组字段 [别名] | 统计函数
(1) FROM
(1.1)JOIN 表 | 子查询
(1.2)ON 过滤条件
(2) WHERE 过滤条件
(3) GROUP BY 分组字段,分组字段…
(4) HAVING 分组后的过滤条件
(6) ORDER BY 字段 [ASC | DESC]
前面的数字代号即为运行的顺序,从1-6的顺序。
可以看到where在第2步,group by在第3步,having在第4步。也就是说,在这三步同时存在于同1个查询语句的情况下,程序运行的逻辑是先对from表数据进行where的筛选之后,才进行分组,分组之后,再进行having的条件第二次筛选数据。
在知道这层逻辑之后,我们来看下面这个例子:
原表:
需求:查询至少有2名男生的班号。
分析:条件:男生、2名
写法一:单用having筛选条件
SELECT class FROM students GROUP BY class HAVING count(ssex='男')>=2;
写法二:where+having组合使用
SELECT class FROM students WHERE ssex='男' GROUP BY class HAVING count(1)>=2;
两条语句执行出来的结果都是一样的:
但是运行效率是不一样的。
写法一将students原表所有数据进行分组,用having对分组后的数据进行2个条件的筛选。
写法二将students原表先进行where条件的筛选缩小数据范围后,才进行分组,分组后,再用having做第二步的筛选。
结论:如果你在数据体量小的情况下,用这两种方法做出来的效率是感受不出来的;但一旦你处理的数据体量很大,运行的效率差别就体现出来了,第二种在分组前对数据进行where条件来缩小数据量,可以提高分组的效率,进行提升查询的速度。
所以,在调优上面来讲,写法二更值得推荐。