GROUP BY :
字面意思是:分组依据
正常逻辑是,分组后的做什么操作?做统计类的,sql中就是聚合函数。所以SELECT 后要有一个以上的聚合函数。不允许包含GROUP BY中以外的字段。
如:
SELECT
avg(logUserId),
sum(orderStatus),
logUserID,
orderStatus,
FROM
wst_log_orders
GROUP BY
logUserID
中的orderStatus,不可用的,否则select语句报错,不执行。
以下是全面的规则:
- (1)Group By子句可以包含任意数目的列,因而可以对分组进行嵌套,进行更细致的分组。
- (2)GroupBy子句中列出的每一列都必须是检索列(或者有效的表达式,注意不能是聚集函数)。如果在SELECT中使用了检索列(或者表达式),则在GroupBy子句中使用相同的表达式,不能使用别名。
- (3)大多数SQL不允许Group By带有可变长度的数据类型(如文本,text类型)。
- (4)除聚集计算语句外,SELECT语句中的每一列都必须在Group By中给出。
- (5)如果分组列中包含具有Null值的行,则Null将作为一个分组返回,如果列中有Null,他们将作为一个分组返回。
- (6)Group By必须出现在Where子句之后,Order By子句之前。
- (7)如果在Group By子句中嵌套了分组,数据将在最后指定的分组上进行汇总。换句话说,在建立分组时,指定的所有列都一起计算(不能从个别的列中取回数据)。
HAVING:
GROUP BY 分完组以后,用HAVING来进行过滤,where没有分组的概念。
SELECT
goodsCatId,
Count(*) AS goods,
shopCatId2
FROM
wst_goods
GROUP BY goodsCatId,shopCatId2
HAVING COUNT(*)>=4
WHERE和HAVING的差别:
- (1)WHERE在数据分组前进行过滤,HAVING在数据分组之后进行过滤,这是个很重要的区别,WHERE排除的行不包括在分组中。这可能会改变计算值,从而影响HAVING子句中基于这些值的过滤掉的分组,根据这个差别,我们可以确定WHERE子句和Group By子句的位置:WHERE子句会在数据分组之前,对行数据进行过滤。
- (2)HAVING与WHERE非常类似,如果不指定Group By,则大多数DBMS会同等的对待他们,不过你自己要区分这一点,使用HAVING时应该结合Group By子句,而WHERE子句用于标准的行级数据过滤。
SELECT
goodsCatId,
shopCatId2
FROM
wst_goods
WHERE
shopCatId2 >10