【数据库知识扫描】 | SQL复习-中篇第10课分组数据

最新推荐文章于 2021-03-05 23:49:47 发布

云胡实验室

最新推荐文章于 2021-03-05 23:49:47 发布

阅读量215

点赞数

分类专栏：【求职实习准备专用】查缺补漏形成知识网文章标签： mysql sql 数据库必知必会第四版查缺补漏

本文链接：https://blog.csdn.net/qq_28930251/article/details/104930983

版权

【求职实习准备专用】查缺补漏形成知识网专栏收录该内容

22 篇文章 0 订阅

订阅专栏

计划永远赶不上变化，早上本来是打算三选一的学习和刷题做题，结果一个逻辑推理题和图形题把我抓了一天。开始怀疑自己的逻辑推理能力，学到一个新名词“空心菜”，好像形容看起来还行，实际上不行。

所以闲话少说，进入今天主题，这一课介绍如何分组数据，以便汇总表内容的子集。这涉及两个新SELECT语句子句：GROUP BY子句和HAVING子句。

10.1 数据分组

上一节课使用SQL聚集函数可以汇总数据。这样，我们就能够对行进行计数，计算和与平均数，不检索所有数据就获得最大值和最小值。

什么时候需要分组数据？比如返回每个供应商提供的产品数目，该怎么办？或者返回只提供一项产品的供应商的产品，或者返回提供10个以上产品的供应商的产品，怎么办？

那么可以使用分组，将数据分为多个逻辑组，对每个组进行聚集计算。

① 创建分组

分组是使用SELECT语句的GROUP BY子句建立的。

来个实例，按vend_id排序并分组数据（vend_id包含产品供应商的ID, num_prods为计算字段（用COUNT(＊)函数建立））：

SELECT vend_id,count(*) AS num_prods FROM Products GROUP BY vend_id;

使用了GROUP BY子句，所以不需要指定计算和估值的每个组。GROUP BY子句指示DBMS分组数据，然后对组而不是整个结果集进行聚集。

那么使用GROUP BY子句，需要遵从这些规定：

□ GROUP BY子句可以包含任意数目的列，因而可以对分组进行嵌套，更细致地进行数据分组。

□ 如果在GROUP BY子句中嵌套了分组，数据将在最后指定的分组上进行汇总。也就是建立分组时，指定所有列都一起计算（所以不能从个别的列取回数据）。

□ GROUP BY子句中列出的每一列都必须是检索列或有效的表达式（但不能是聚集函数）。如果在SELECT中使用表达式，则必须在GROUP BY子句中指定相同的表达式。不能使用别名，意味着别名失效，并且需要是真实结果。

□ 大多数SQL实现不允许GROUP BY列带有长度可变的数据类型（如文本或备注型字段）。

□ 除聚集计算语句外，SELECT语句中的每一列都必须在GROUP BY子句中给出。

□ 如果分组列中包含具有NULL值的行，则NULL将作为一个分组返回。如果列中有多行NULL值，它们将分为一组。

□ GROUP BY子句必须出现在WHERE子句之后，ORDER BY子句之前。巧记“WGO”~我们走~

ALL子句问题：部分DBMS支持在GROUP BY中可选ALL子句，可用来返回所有分组，即使没有匹配行（这种情况返回NULL），是否支持看文档。

相对位置指定列：有的SQL实现允许根据SELECT列表中的位置指定GROUP BY的列。例如，GROUP BY 2, 1可表示按选择的第二个列分组，然后再按第一个列分组。虽然这种速记语法很方便，但并非所有SQL实现都支持，并且使用它容易在编辑SQL语句时出错。

10.3 过滤分组

除了能用GROUP BY分组数据外，SQL还允许过滤分组，规定包括哪些分组，排除哪些分组。例如可能想要列出至少有两个订单的所有顾客。为此，必须基于完整的分组而不是个别的行进行过滤。

这里讨论一个点，“WHERE子句”与“GROUP BY子句”是否都能完成这个任务？实际上，不行，我们要理解行与分组的概念，书中提到，WHERE来说没有分组的概念。

那么为了完成分组过滤，我们可以学习些什么完成这个过滤工作？

HAVING子句，类似于WHERE，说类似都轻了，前面学到的WHERE子句完成的工作都可以用HAVING来替代，其中不同点，也是唯一的区别的是，WHERE的作用对象是行，HAVING对组。

HAVING支持所有WHERE操作符：前面学过的这些有关WHERE的所有技术和选项都适用于HAVING。它们的句法是相同的，只是关键字有差别。

说太多不如来看个例子，选出订单不小于2的顾客id：

SELECT cust_id,count(*) AS orders FROM Orders GROUP BY cust_id  HAVING COUNT(*)>=2;

这个时候，如果使用WHERE子句将会不起作用，因为我们拿到的是分组的值。

HAVING和WHERE的差别：要是还不明白，可以这一想，WHERE在数据分组前进行过滤，HAVING在数据分组后进行过滤。这是一个重要的区别，WHERE排除的行不包括在分组中。这可能会改变计算值，从而影响HAVING子句中基于这些值过滤掉的分组。

一直在介绍两者的区别，有没有一起上的情况？

有，需求永远比需要多，假如要进一步过滤，比如返回过去12个月内具有两个以上订单的顾客，就可以增加一条WHERE子句，过滤出过去12个月内下过的订单，然后再增加HAVING子句过滤出具有两个以上订单的分组。

来个实例，走走看，列出具有两个以上产品且其价格大于等于4的供应商：

 SELECT vend_id,COUNT(*) AS num_prods FROM Products WHERE prod_price >= 4 GROUP BY vend_id HAVING COUNT(*) >= 2;

这条语句中，第一行是使用了聚集函数的基本SELECT语句，很像前面的例子。

WHERE子句过滤所有prod_price至少为4的行，然后按vend_id分组数据，HAVING子句过滤计数为2或2以上的分组。

如果没有WHERE子句，就会多检索出一行（供应商DLL01，销售4个产品，价格都在4以下），可以来看一哈子：

可以看出来区别了，但是我们还是要注意：使用HAVING和WHEREHAVING与WHERE非常类似，如果不指定GROUPBY，则大多数DBMS会同等对待它们。不过，我们需要能区分这一点。使用HAVING时应该结合GROUP BY子句，而WHERE子句用于标准的行级过滤。

10.4 分组和排序

讲到分组排序，GROUP BY 和 ORDER BY也要出来打架了，说到这两个，它们经常完成相同的操作，比起上面的不同，还要相似些，那么书中给出了总结，下表列举了不同之处：

书上跟着这张表后面的一大串描述，我真的有点晕了，试着理解一下，GROUP BY处理完的数据是以分组顺序输出的，但它不是说一定会这样，不是人家的责任范围，而且就算人家做了，难道我们就啥也不提要求吗？还是要改顺序的，所以到了改顺序的时候就到了ORDER BY大兄弟排上用场的时候了。

ORDER BY使用问题：一般在使用GROUP BY子句时，应该也给出ORDER BY子句。这是保证数据正确排序的唯一方法。千万不要仅依赖GROUP BY排序数据。别忘了人家！人家ORDER BY才是正经排序子句！

那么又到了实例环节，任何强调性重要不如走一遍！

检索包含三个或更多物品的订单号和订购物品的数目：

SELECT order_num,COUNT(*) AS items FROM OrderItems GROUP BY order_num HAVING COUNT(*) >= 3;

做到这还不行，甲方说，麻烦帮我排下序，谢谢！然后接着来：

加上我们的ORDER BY子句以后，明显结果按照items的顺序排好了。

10.5 SELECT子句顺序

学习四则运算的时候，学完加减乘除，就开始分老大，这道理大家都需要明白，优先级的评定。那么SELECT语句中子句的顺序，必须遵循一定的规律，可以看看书上总结的：

S - F - W - G - H - O，书粉我够好喔~

后面还会学到一个执行顺序，所以，这里就先理解到这里。记住，是子句顺序，也就是写的顺序，其中WGO是比较重要不要搞混。

那么这一课就学完了~

依旧是激励~刻意练习，每日精进。

云胡实验室

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【数据库知识扫描】 | SQL复习-中篇第10课分组数据

计划永远赶不上变化，早上本来是打算三选一的学习和刷题做题，结果一个逻辑推理题和图形题把我抓了一天。开始怀疑自己的逻辑推理能力，学到一个新名词“空心菜”，好像形容看起来还行，实际上不行。所以闲话少说，进入今天主题，这一课介绍如何分组数据，以便汇总表内容的子集。这涉及两个新SELECT语句子句：GROUP BY子句和HAVING子句。
复制链接

扫一扫