04 SQL基础 -- 聚合、分组与排序

在这里插入图片描述

一、对表进行聚合查询

1.1 聚合函数

SQL中用于汇总的函数叫做聚合函数。以下五个是最常用的聚合函数:

  • COUNT:计算表中的记录数(行数)
  • SUM:计算表中数值列中数据的合计值
  • AVG:计算表中数值列中数据的平均值
  • MAX:求出表中任意列中数据的最大值
  • MIN:求出表中任意列中数据的最小值

请沿用第一章的数据,使用以下操作熟练函数:

– 计算全部数据的行数(包含NULL)

SELECT COUNT(*)
FROM product;
enter image description here

– 计算NULL以外数据的行数

SELECT COUNT(purchase_price)
FROM product;
enter image description here

– 计算销售单价和进货单价的合计值

SELECT SUM(sale_price), SUM(purchase_price)
FROM product;
enter image description here

– 计算销售单价和进货单价的平均值

SELECT AVG(sale_price), AVG(purchase_price)
FROM product;
enter image description here

– MAX和MIN也可用于非数值型数据

SELECT MAX(regist_date), MIN(regist_date)
FROM product;
enter image description here

1.2 使用聚合函数删除重复值

– 计算去除重复数据后的数据行数
SELECT COUNT(DISTINCT product_type)
FROM product;
enter image description here

– 是否使用DISTINCT时的动作差异(SUM函数)

SELECT SUM(sale_price), SUM(DISTINCT sale_price)
FROM product;
enter image description here

1.3 常用法则

  • COUNT函数的结果根据参数的不同而不同。COUNT(*)会得到包含NULL的数据行数,而COUNT(<列名>)会得到NULL之外的数据行数
  • 聚合函数会将NULL排除在外。但COUNT(*)例外,并不会排除NULL
  • MAX/MIN函数几乎适用于所有数据类型的列,SUM/AVG函数只适用于数值类型的列
  • 想要计算值的种类时,可以在COUNT函数的参数中使用DISTINCT
  • 在聚合函数的参数中使用DISTINCT,可以删除重复数据

二、对表进行分组

2.1 GROUP BY 语句

之前使用聚合函数都是会整个表的数据进行处理,当你想将进行分组汇总时(即:将现有的数据按照某列来汇总统计),GROUP BY可以帮助你:

SELECT <列名1>,<列名2>, <列名3>, ……
FROM <表名>
GROUP BY <列名1>, <列名2>, <列名3>, ……;

看一看是否使用GROUP BY语句的差异:

– 按照商品种类统计数据行数

SELECT product_type, COUNT(*)
FROM product
GROUP BY product_type;
enter image description here

– 不含GROUP BY

SELECT product_type, COUNT(*)
FROM product
enter image description here

按照商品种类对表进行切分
enter image description here

这样,GROUP BY 子句就像切蛋糕那样将表进行了分组。在 GROUP BY 子句中指定的列称为聚合键或者分组列

2.2 聚合键中包含NULL时

将进货单价(purchase_price)作为聚合键举例:

SELECT purchase_price, COUNT(*)
FROM product
GROUP BY purchase_price;
enter image description here

SELECT purchase_price, COUNT(purchase_price)
FROM product
GROUP BY purchase_price;
enter image description here

此时会将NULL作为一组特殊数据进行处理

2.3 GROUP BY 书写位置

GROUP BY的子句书写顺序有严格要求,不按要求会导致SQL无法正常执行,目前出现过的子句书写****顺序为:

1.**SELECT → 2. FROM → 3. WHERE → 4. GROUP BY **

其中前三项用于筛选数据,GROUP BY对筛选出的数据进行处理

2.4 在 WHERE 子句中使用 GROUP BY

SELECT purchase_price, COUNT(*)
FROM product
WHERE product_type = ‘衣服’
GROUP BY purchase_price;
enter image description here

2.5 常见错误

在使用聚合函数及GROUP BY子句时,经常出现的错误有:

  • 在聚合函数的SELECT子句中写了聚合健以外的列 使用COUNT等聚合函数时,SELECT子句中如果出现列名,只能是GROUP BY子句中指定的列名(也就是聚合键)
  • 在GROUP BY子句中使用列的别名 SELECT子句中可以通过AS来指定别名,但在GROUP BY中不能使用别名。因为在DBMS中 ,SELECT子句在GROUP BY子句后执行
  • 在WHERE中使用聚合函数 原因是聚合函数的使用前提是结果集已经确定,而WHERE还处于确定结果集的过程中,所以相互矛盾会引发错误。如果想指定条件,可以在SELECT,HAVING(下面马上会讲)以及ORDER BY子句中使用聚合函数

三、为聚合结果指定条件

3.1 用 HAVING 得到特定分组

将表使用GROUP BY分组后,怎样才能只取出其中两组?
enter image description here

这里WHERE不可行,因为,WHERE子句只能指定记录(行)的条件,而不能用来指定组的条件(例如,“数据行数为 2 行”或者“平均值为 500”等)

可以在GROUP BY后使用HAVING子句

HAVING的用法类似WHERE

3.2 HAVING 特点

HAVING子句用于对分组进行过滤,可以使用数字、聚合函数和GROUP BY中指定的列名(聚合键)

– 数字

SELECT product_type, COUNT()
FROM product
GROUP BY product_type
HAVING COUNT(
) = 2;
enter image description here

– 错误形式(因为product_name不包含在GROUP BY聚合键中)

SELECT product_type, COUNT(*)
FROM product
GROUP BY product_type
HAVING product_name = ‘圆珠笔’;
enter image description here

四、对查询结果进行排序

4.1 ORDER BY

SQL中的执行结果是随机排列的,当需要按照特定顺序排序时,可已使用ORDER BY子句

SELECT <列名1>, <列名2>, <列名3>, ……
FROM <表名>
ORDER BY <排序基准列1>, <排序基准列2>, ……

默认为升序排列,降序排列为DESC

– 降序排列

SELECT product_id, product_name, sale_price, purchase_price
FROM product
ORDER BY sale_price DESC;
enter image description here

– 多个排序键

SELECT product_id, product_name, sale_price, purchase_price
FROM product
ORDER BY sale_price, product_id;
enter image description here

– 当用于排序的列名中含有NULL时,NULL会在开头或末尾进行汇总

SELECT product_id, product_name, sale_price, purchase_price
FROM product
ORDER BY purchase_price;
enter image description here

4.2 ORDER BY 中列名可以使用别名

前文讲GROUP BY中提到,GROUP BY 子句中不能使用SELECT 子句中定义的别名,但是在 ORDER BY 子句中却可以使用别名。为什么在GROUP BY中不可以而在ORDER BY中可以呢?

这是因为SQL在使用 HAVING 子句时 SELECT 语句的执行顺序为:

FROM → WHERE → GROUP BY → HAVING → SELECT → ORDER BY

其中SELECT的执行顺序在 GROUP BY 子句之后,ORDER BY 子句之前。也就是说,当在ORDER BY中使用别名时,已经知道了SELECT设置的别名存在,但是在GROUP BY中使用别名时还不知道别名的存在,所以在ORDER BY中可以使用别名,但是在GROUP BY中不能使用别名

五、练习题

练习题1

请指出下述SELECT语句中所有的语法错误

SELECT product_id, SUM(product_name)
–本SELECT语句中存在错误。
FROM product
GROUP BY product_type
WHERE regist_date > ‘2009-09-01’;

正确写法:

SELECT product_type, SUM(product_name)
FROM product
WHERE regist_date > ‘2009-09-01’
GROUP BY product_type;
enter image description here

练习题2

请编写一条SELECT语句,求出销售单价(sale_price列)合计值大于进货单价(purchase_price列)合计值1.5倍的商品种类。执行结果如下所示
enter image description here

SELECT product_type, sum_sale_price, sum_purchase_price
FROM (
SELECT product_type, SUM(sale_price) as sum_sale_price, SUM(purchase_price) as sum_purchase_price
FROM product
GROUP BY product_type
) a
WHERE sum_sale_price > sum_purchase_price * 1.5;
enter image description here

练习题3

此前我们曾经使用SELECT语句选取出了product(商品)表中的全部记录。当时我们使用了ORDERBY子句来指定排列顺序,但现在已经无法记起当时如何指定的了。请根据下列执行结果,思考ORDERBY子句的内容
enter image description here

SELECT *
FROM product
ORDER BY
CASE WHEN regist_date IS NULL THEN 1 ELSE 0 END DESC,
regist_date DESC, sale_price;
enter image description here

  • 59
    点赞
  • 44
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

腾飞开源

你的鼓励将是我创作的最大动力!

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值