typora-copy-images-to: SQL 必知必会
文章目录
SQL 必知必会 Chapter 10 分组数据
10.1 数据分组
-
介绍如何分组数据,以便汇总表内容的子集
- 涉及GROUP BY 子句和HAVING 子句
-
分组可以将数据分为多个逻辑组,对每个组进行聚集计算
10.2 创建分组
SELECT vend_id, COUNT(*) AS num_prods
FROM Products
GROUP BY vend_id;
# 有的 SQL实现允许根据 SELECT 列表中的位置指定 GROUP BY 的列。例如, GROUP # BY 2, 1 可表示按选择的第二个列分组,然后再按第一个列分组。虽然这种速记语法
# 很方便,但并非所有 SQL实现都支持,并且使用它容易在编辑 SQL语句时出错
- GROUP BY子句可以包含任意数目的列,因此可以对分组进行嵌套
- 如果对GROUP BY进行了嵌套,那么数据将在最后指定的分组上进行汇总
- GROUP BY 子句中列出的每一列都必须是建所列货有效的表达式(不可以是聚集函数)
- 大多数 SQL实现不允许 GROUP BY 列带有长度可变的数据类型(如文本或备注型字段)
- 除聚集计算语句外, SELECT 语句中的每一列都必须在 GROUP BY 子句中给出
- 如果分组列中包含具有 NULL 值的行,则 NULL 将作为一个分组返回。如果列中有多行 NULL 值,它们将分为一组
- GROUP BY 子句必须出现在 WHERE 子句之后, ORDER BY 子句之前
10.3 过滤分组
-
例如,你可能想要列出至少有两个订单的所有顾客
-
因为 WHERE 过滤指定的是行而不是分组。事实上, WHERE 没有分组的概念
-
目前为止所学过的所有类型的 WHERE 子句都可以用 HAVING 来替代。唯一的差别是, WHERE过滤行,而 HAVING 过滤分组
SELECT cust_id, COUNT(*) AS orders
FROM Orders
GROUP BY cust_id
HAVING COUNT(*) >= 2;
- HAVING 和 WHERE 的差别
- WHERE 在数据分组前进行过滤, HAVING 在数据分组后进行过滤。这是一个重要的区别, WHERE 排除的行不包括在分组中。这可能会改变计算值,从而影响 HAVING 子句中基于这些值过滤掉的分组
# 列出具有两个以上产品且其价格大于等于 4 的供应商
SELECT vend_id, COUNT(*) AS num_prods
FROM Products
WHERE prod_price >= 4
GROUP BY vend_id
HAVING COUNT(*) >= 2;
# 去掉WHERE子句
SELECT vend_id, COUNT(*) AS num_prods
FROM Products
GROUP BY vend_id
HAVING COUNT(*) >= 2;
- 使用 HAVING 时应该结合 GROUP BY 子句,而 WHERE 子句用于标准的行级过滤
10.4 分组和排序
- 一般在使用 GROUP BY 子句时,应该也给出 ORDER BY 子句。这是保证数据正确排序的唯一方法。千万不要仅依赖 GROUP BY 排序数据
# 检索包含三个或更多物品的订单号和订购物品的数目
SELECT order_num, COUNT(*) AS items
FROM OrderItems
GROUP BY order_num
HAVING COUNT(*) >= 3;
# 对上述结果进行排序输出:
SELECT order_num, COUNT(*) AS items
FROM OrderItems
GROUP BY order_num
HAVING COUNT(*) >= 3
ORDER BY items, order_num;
10.5 SELECT 子句顺序
10.6 小结
- 介绍了如何用 SQL聚集函数对数据进行汇总计算。这一课讲授了如何使用 GROUP BY 子句对多组数据进行汇总计算,返回每个组的结果。我们看到了如何使用 HAVING 子句过滤特定的组,还知道了 ORDER BY和 GROUP BY 之间以及 WHERE 和 HAVING 之间的差异