使用SQL进行复杂过滤分组，巧妙组合应用详解

周同学的技术栈

已于 2024-08-11 22:35:27 修改

阅读量266

点赞数 8

分类专栏：数据库技术之路文章标签：数据库

于 2024-08-11 22:34:44 首次发布

本文链接：https://blog.csdn.net/zgt_certificate/article/details/141113412

版权

数据库技术之路专栏收录该内容

78 篇文章 0 订阅

订阅专栏

在这里插入图片描述

数据库中的过滤分组

在数据库查询中，过滤分组是指对数据进行分组操作后，再对这些分组结果进行进一步的筛选。通常在执行聚合查询时，我们会首先使用GROUP BY子句将数据分成不同的组，然后使用HAVING子句来过滤这些分组。

过滤分组的关键概念

GROUP BY子句：
- GROUP BY子句用于将查询结果按一个或多个字段分组。每个分组中的数据会被聚合成一条记录。例如，可以根据客户ID对订单数据进行分组，以便计算每个客户的订单数量。
聚合函数：
- 聚合函数（如COUNT、SUM、AVG、MAX、MIN等）用于对分组后的数据进行汇总计算。例如，COUNT(*)用于计算每个分组中的行数。
HAVING子句：
- HAVING子句用于过滤分组后的数据。它通常与聚合函数一起使用，以筛选出符合特定条件的分组。例如，筛选出订单数量大于等于两个的客户分组。
WHERE子句与HAVING子句的区别：
- WHERE子句在分组之前过滤数据，适用于单行的条件筛选。
- HAVING子句在分组之后过滤数据，适用于聚合后的分组条件筛选。

详细举例

例子1：简单分组过滤

SELECT department, COUNT(*) AS employee_count
FROM Employees
GROUP BY department
HAVING COUNT(*) > 10;

department表示部门名称，COUNT(*)计算每个部门的员工数量。
使用GROUP BY将员工按部门分组。
使用HAVING子句过滤出员工数量大于10的部门。

例子2：结合WHERE和HAVING的分组过滤

SELECT customer_id, SUM(order_amount) AS total_spent
FROM Orders
WHERE order_date >= '2023-01-01'
GROUP BY customer_id
HAVING SUM(order_amount) >= 1000;

customer_id表示客户ID，order_amount表示订单金额。
使用WHERE子句筛选出2023年及以后下的订单。
使用GROUP BY根据客户ID分组，计算每个客户的订单总金额。
使用HAVING子句过滤出总金额大于或等于1000的客户。

例子3：复杂分组条件筛选

SELECT product_category, AVG(price) AS avg_price
FROM Products
GROUP BY product_category
HAVING AVG(price) BETWEEN 50 AND 200;

product_category表示产品类别，price表示产品价格。
使用GROUP BY根据产品类别分组。
使用HAVING子句筛选出平均价格在50到200之间的产品类别。

例子4：多条件分组过滤

SELECT vendor_id, COUNT(*) AS product_count, MAX(price) AS max_price
FROM Products
WHERE availability = 'In Stock'
GROUP BY vendor_id
HAVING COUNT(*) >= 5 AND MAX(price) < 500;

vendor_id表示供应商ID，availability表示产品的库存状态。
使用WHERE子句筛选出库存中的产品。
使用GROUP BY根据供应商ID分组。
使用HAVING子句筛选出产品数量大于或等于5且最高价格低于500的供应商。

例子5：嵌套查询中的分组过滤

SELECT region, AVG(total_sales) AS avg_sales
FROM (
    SELECT region, SUM(sales_amount) AS total_sales
    FROM Sales
    GROUP BY region, sales_rep_id
) AS regional_sales
GROUP BY region
HAVING AVG(total_sales) > 10000;

首先，内部查询将销售数据根据地区和销售代表ID进行分组，并计算每个分组的总销售额。
外部查询根据地区对内部查询结果再次分组，并计算每个地区的平均销售额。
使用HAVING子句筛选出平均销售额大于10000的地区。

过滤分组使用SQL字句

在SQL查询中使用HAVING子句来过滤分组，以及HAVING和WHERE子句的区别。内容包含以下几个部分：

GROUP BY和WHERE子句的基础：
- 在SQL中，GROUP BY用于将结果集中的数据行按一个或多个列进行分组。WHERE子句用于在数据被分组之前过滤行。
HAVING子句的作用：
- 在分组操作之后，有时候需要进一步过滤分组结果。例如，想要列出至少有两个订单的客户，而不关心他们具体的订单详情。此时，使用HAVING子句来过滤分组结果。
- HAVING子句与WHERE子句类似，但它作用于分组后的数据，而不是分组之前的数据。
HAVING与WHERE的区别：
- WHERE子句在数据分组之前就进行过滤，而HAVING子句则在数据分组之后再进行过滤。这是两者最大的区别。WHERE子句过滤的是行，而HAVING过滤的是基于聚合后的分组。

详细举例

为了更好地理解HAVING和WHERE的使用，提供以下两个例子：

例子1：使用HAVING过滤分组

SELECT cust_id, COUNT(*) AS orders
FROM Orders
GROUP BY cust_id
HAVING COUNT(*) >= 2;

cust_id表示客户ID，COUNT(*)表示每个客户的订单数量。
使用GROUP BY对客户ID进行分组，然后使用HAVING子句过滤出订单数量大于或等于2的客户。
过滤后，只会显示那些有两个或以上订单的客户。

例子2：结合WHERE和HAVING的过滤

SELECT vend_id, COUNT(*) AS num_prods
FROM Products
WHERE prod_price >= 4
GROUP BY vend_id
HAVING COUNT(*) >= 2;

vend_id表示供应商ID，prod_price表示产品价格，COUNT(*)表示每个供应商的产品数量。
首先，使用WHERE子句过滤出价格大于等于4的产品。
然后，使用GROUP BY根据供应商ID分组，统计每个供应商的产品数量。
最后，使用HAVING子句过滤出产品数量大于或等于2的供应商。
WHERE子句用于在分组前过滤数据，通常针对单个行的条件。
HAVING子句用于在分组后过滤数据，通常针对聚合后的分组条件。
在某些情况下，WHERE和HAVING可以结合使用，如例子2所示，先用WHERE筛选符合条件的行，再用HAVING筛选符合条件的分组。

非常感谢您读到这里！如果您觉得这篇文章对您有帮助，可以关注一下博主。关注后，您将第一时间获得最新的AI、云计算、运维（Linux、数据库，容器等）技术，以及更多实用的技能干货。

让AI工具成为你的得力助手，感受AI工具的无限可能，让复杂的任务变得简单，让你的工作更加轻松和高效。

周同学的技术栈

关注

8
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
使用SQL进行复杂过滤分组，巧妙组合应用详解

例如，可以根据客户ID对订单数据进行分组，以便计算每个客户的订单数量。是指对数据进行分组操作后，再对这些分组结果进行进一步的筛选。首先，内部查询将销售数据根据地区和销售代表ID进行分组，并计算每个分组的总销售额。子句类似，但它作用于分组后的数据，而不是分组之前的数据。子句在分组之后过滤数据，适用于聚合后的分组条件筛选。子句用于在分组后过滤数据，通常针对聚合后的分组条件。子句用于在分组前过滤数据，通常针对单个行的条件。子句在分组之前过滤数据，适用于单行的条件筛选。根据客户ID分组，计算每个客户的订单总金额。
复制链接

扫一扫

专栏目录