数据分组
目前的所有计算都是在表中所有数据的或者匹配的WHERE字句的数据进行的
SELECT COUNT(*)AS num_cust
FROM Customers
WHERE vend_id='DLL01'
如果要返回每个供应商提供的产品数,或者是返回十个产品以上的供应商的产品,就需要使用到分组数据。
创建分组
分组是用SELECT语句的GROUP BY字句建立的
SELECT vend_id,COUNT(*)AS num_prods
FROM Products
GROUP BY vend_id;
vend_id包含供应商的ID,num_prods是计算字段,GROUP BY指示按照vend_id排序并分组数据。
注意:GROUP BY函数必须有“聚合函数”来配合才能使用,使用时至少需要一个分组标志字段。
如果在SELECT中使用表达式,那么GROUP BY必须指定相同的表达式,不能使用别名
GROUP BY必须在WHERE之后,ORDER BY之前。
过滤分组
除了GROUP BY分组以外,SQL还允许过滤分组,规定包括哪些分组,排除哪些分组。
使用HAVING字句,很类似WHERE,但是HAVING可以过滤分组,WHERE不行。
SELECT cust_id,COUNT(*)AS orders
FROM Orders
GROUP BY cust_id
HAVING COUNT(*)>=2;
HAVING和WHERE的区别
WHERE在数据分组之前进行过滤,HAVING在数据分组之后进行过滤
举个例子,同时用到HAVING和WHERE:
SELECT vend_id,COUNT(*)AS num_prods
FROM Products
WHERE prod_price>=4
GROUP BY vend_id
HAVING COUNT(*)>=2;
WHERE字句过滤prod_price至少为4的行,然后按vend_id分组数据,HAVING记录计数为2或以上的组
分组和排序
GROUP BY 和ORDER BY的关系
ORDER BY对输出进行排序,GROUP BY仅仅分组,可以不排序。