在本教程中,您将学习如何使用MySQL GROUP BY根据指定列或表达式的值将行进行分组到子组。
1. MySQL GROUP BY子句简介
GROUP BY子句通过列或表达式的值将一组行分组为一个小分组的汇总行记录。 GROUP BY子句为每个分组返回一行。换句话说,它减少了结果集中的行数。
经常使用GROUP BY子句与一起使用,如,,,和。SELECT子句中使用聚合函数来计算有关每个分组的信息。
GROUP BY子句是的可选子句。 下面是GROUP BY子句语法:
SELECT c1, c2,..., cn, aggregate_function(ci) FROM table WHERE where_conditions GROUP BY c1 , c2,...,cn;
GROUP BY子句必须出现在FROM和WHERE子句之后。 在GROUP BY关键字之后是一个以逗号分隔的列或表达式的列表,这些是要用作为条件来对行进行分组。
2. MySQL GROUP BY示例
2.1 简单的MySQL GROUP BY示例
我们来看看中的orders表,其结构如下所示 –
mysql> desc orders; +----------------+-------------+------+-----+---------+-------+ | Field | Type | Null | Key | Default | Extra | +----------------+-------------+------+-----+---------+-------+ | orderNumber | int(11) | NO | PRI | NULL | | | orderDate | date | NO | | NULL | | | requiredDate | date | NO | | NULL | | | shippedDate | date | YES | | NULL | | | status | varchar(15) | NO | | NULL | | | comments | text | YES | | NULL | | | customerNumber | int(11) | NO | MUL | NULL | | +----------------+-------------+------+-----+---------+-------+ 7 rows in set
假设要将订单状态的值分组到子组中,则要使用GROUP BY子句并指定按status列来执行分组,如下查询:
SELECT status FROM orders GROUP BY status;
执行上面查询语句,得到以下结果 –
+------------+ | status | +------------+ | Cancelled | | Disputed | | In Process | | On Hold | | Resolved | | Shipped | +------------+
可以看到,GROUP BY子句返回状态(status)值是唯一的。它像运算符一样工作,如下面的查询所示:
SELECT DISTINCT status FROM orders;
执行上面查询语句,得到以下结果 –
+------------+ | status | +------------+ | Shipped | | Resolved | | Cancelled | | On Hold | | Disputed | | In Process | +------------+
2.2 MySQL GROUP BY与聚合函数
可使用来执行一组行的计算并返回单个值。 GROUP BY子句通常与聚合函数一起使用以执行计算每个分组并返回单个值。
例如,如果想知道每个状态中的订单数,可以使用COUNT函数与GROUP BY子句查询语句,如下所示:
SELECT status, COUNT(*) AS total_number FROM orders GROUP BY status;
执行上面查询语句,得到以下结果 –
+------------+--------------+ | status | total_number | +------------+--------------+ | Cancelled | 6 | | Disputed | 3 | | In Process | 6 | | On Hold | 4 | | Resolved | 4 | | Shipped | 303 | +------------+--------------+ 6 rows in set
请参阅以下订单(orders)和订单详细(orderdetails)表,它们的ER图如下所示 –
要按状态获取所有订单的总金额,可以使用orderdetails表orders表,并使用SUM函数计算总金额。请参阅以下查询:
SELECT status, SUM(quantityOrdered * priceEach) AS amount FROM orders INNER JOIN orderdetails USING (orderNumber) GROUP BY status;
执行上面查询,得到以下结果 –
+------------+------------+ | status | amount | +------------+------------+ | Cancelled | 238854.18 | | Disputed | 61158.78 | | In Process | 135271.52 | | On Hold | 169575.61 | | Resolved | 134235.88 | | Shipped | 8865094.64 | +------------+------------+
类似地,以下查询返回订单号和每个订单的总金额。
SELECT orderNumber, SUM(quantityOrdered * priceEach) AS total FROM orderdetails GROUP BY orderNumber;
执行上面查询,得到以下结果 –
+-------------+----------+ | orderNumber | total | +-------------+----------+ | 10100 | 10223.83 | | 10101 | 10549.01 | | 10102 | 5494.78 | | 10103 | 50218.95 | | 10104 | 40206.20 | | 10105 | 53959.21 | |... ... |... 这里省略了一大波数据 ... |... ... | 10423 | 8597.73 | | 10424 | 29310.30 | | 10425 | 41623.44 | +-------------+----------+ 326 rows in set
2.3 MySQL GROUP BY用表达式示例
除了列之外,可以按表达式对行进行分组。以下查询获取每年的总销售额。
SELECT YEAR(orderDate) AS year, SUM(quantityOrdered * priceEach) AS total FROM orders INNER JOIN orderdetails USING (orderNumber) WHERE status = 'Shipped' GROUP BY YEAR(orderDate);
执行上面查询,得到以下结果 –
+------+------------+ | year | total | +------+------------+ | 2013 | 3223095.80 | | 2014 | 4300602.99 | | 2015 | 1341395.85 | +------+------------+
在这个例子中,我们使用函数从订单日期(orderDate)中提取年份数据。只包括已发货(Shipped)状态的订单。 请注意,SELECT子句中出现的表达式必须与GROUP BY子句中的相同。
3. MySQL GROUP BY与HAVING子句
可使用子句过滤GROUP BY子句返回的分组。以下查询使用HAVING子句来选择2013年以后的年销售总额。
SELECT YEAR(orderDate) AS year, SUM(quantityOrdered * priceEach) AS total FROM orders INNER JOIN orderdetails USING (orderNumber) WHERE status = 'Shipped' GROUP BY year HAVING year > 2013;
执行上面查询,得到以下结果 –
+------+------------+ | year | total | +------+------------+ | 2014 | 4300602.99 | | 2015 | 1341395.85 | +------+------------+
4. GROUP BY子句:MySQL与标准SQL
标准SQL不允许使用GROUP BY子句中的别名,但MySQL支持此选项。以下查询从订单日期提取年份,并对每年的订单进行计数。该year用作表达式YEAR(orderDate)的别名,它也用作GROUP BY子句中的别名,此查询在标准SQL中无效。参考以下查询 –
SELECT YEAR(orderDate) AS year, COUNT(orderNumber) FROM orders GROUP BY year;
执行上面查询,得到以下结果 –
+------+--------------------+ | year | COUNT(orderNumber) | +------+--------------------+ | 2013 | 111 | | 2014 | 151 | | 2015 | 64 | +------+--------------------+
MySQL还允许您以升序或降序(标准SQL不能提供)对组进行排序。默认顺序是升序。例如,如果要按状态获取订单数量并按降序对状态进行排序,则可以使用带有DESC的GROUP BY子句,如下查询语句:
SELECT status, COUNT(*) FROM orders GROUP BY status DESC;
执行上面查询,得到以下结果 –
+------------+----------+ | status | COUNT(*) | +------------+----------+ | Shipped | 303 | | Resolved | 4 | | On Hold | 4 | | In Process | 6 | | Disputed | 3 | | Cancelled | 6 | +------------+----------+
请注意,在GROUP BY子句中使用DESC以降序对状态进行排序。我们还可以在GROUP BY子句中明确指定ASC,按状态对分组进行升序排序。
在本教程中,我们向您演示了如何使用MySQL GROUP BY子句根据列或表达式的值将行分组到子组中。
¥ 我要打赏 纠错/补充 收藏