over partition by 和 group by 的区别

group by:对检索结果的保留行进行单纯分组,返回聚合之后的组的数据统计值的记录。划分为多组,每组返回一行。
partition by:返回分组里的每一条数据,在应用关联的开窗函数前确定行集的分区和排序,然后,开窗函数将计算窗口中的每一行的值。

例:
表中的数据如下
create temp table test as
select ‘A01’ as A,‘001’ as B,10 as C
union select ‘A01’, ‘001’, 20
union select ‘A02’, ‘002’, 20
;

ABC
A0100110
A0100120
A0200220

分别运行group by和partition by
SELECT A,B,MAX(C) OVER( PARTITION BY A,B)
FROM TEST
;
结果为

ABMAX
A0100120
A0100120
A0200220

SELECT A,B,MAX(C)
FROM TEST
GROUP BY 1,2
;
结果为

ABMAX
A0100120
A0200220
partition by和group by是在SQL中用于分组和聚合数据的关键字,它们之间有以下区别: 1. 功能不同: - group by是用于将数据按照指定的列进行分组,然后对每个组进行聚合操作,例如求和、计数等。 - partition by是用于在分析函数中指定分组的方式,它定义了每个分组的范围,然后在每个分组内进行计算。 2. 执行顺序不同: - 在SQL语句的执行顺序中,group by是在where之后、select之前执行的,它先根据指定的列进行分组,然后对每个组进行聚合操作。 - partition by是在select之后执行的,它根据指定的列进行分组,并在每个分组内进行计算。 3. 使用场景不同: - group by适用于需要对整个数据集进行分组和聚合的情况,例如统计每个部门的销售总额。 - partition by适用于需要在每个分组内进行计算的情况,例如计算每个部门的销售额占比。 下面是一个示例,演示了partition by和group by的区别: 假设有一个表sales,包含以下字段:department(部门)、product(产品)、quantity(数量)、price(单价)。 1. 使用group by计算每个部门的销售总额: ```sql SELECT department, SUM(quantity * price) AS total_sales FROM sales GROUP BY department; ``` 2. 使用partition by计算每个部门的销售额占比: ```sql SELECT department, product, quantity * price / SUM(quantity * price) OVER (PARTITION BY department) AS sales_ratio FROM sales; ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值