挑战100天不停更之hive sql第4天 - 窗口大小的控制

本文通过实例解析如何使用窗口函数LAG()和LEAD()在SQL中实现按'a'分组的b字段排序时,计算c列的前一行后一行和,以及求平均值。涉及到了窗口大小的控制和子查询技巧。适合学习数据库窗口函数的进阶者。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

🌿挑战100天不停更,刷爆 hive sql🧲

NUM:第4天 - 窗口大小的控制

详情请点击🔗我的专栏🖲,共同学习,一起进步~

🧨不废话,刷题~~🧨

表结构

image.png

建表

INSERT into t4 values('2014', 'A', 3),('2014' ,'B' ,1 ),('2014' ,'C' ,2 ),('2015' ,'A' ,4),('2015', 'D' ,3);
SELECT * FROM t4;

1)按a分组按照b字段排序,求c的前一行后后一行的和

思路

LAG(col,n,DEFAULT) 用于统计窗口内往上第n行值 第一个参数为列名,第二个参数为往上第n行(可选,默认为1),第三个参数为默认值(当往上第n行为NULL时候,取默认值,如不指定,则为NULL)

与LAG相反
LEAD(col,n,DEFAULT) 用于统计窗口内往下第n行值 第一个参数为列名,第二个参数为往下第n行(可选,默认为1),第三个参数为默认值(当往下第n行为NULL时候,取默认值,如不指定,则为NULL)

SQL

select
a,
b,
lag(c,1,0) over(partition by a order by b)+ lead(c,1,0) over(partition by a order by b) as sum_c
from
t4;

输出结果

image.png

2)按照a分组,b排序,前一行和当前行求平均值

思路

子查询当前行的上一行,判断lag_c 是否为null,默认第一行为null

SQL

SELECT a,
       b,
--       if(lag_c is NULL, c, (c + lag_c) / 2) as avg_c
       case when lag_c is null then c else (c + lag_c)/2 end as avg_c 
FROM (select a,
             b,
             c,
             lag(c, 1) over (partition by a order by b) as lag_c
      from t4) tmp;

输出结果

image.png

评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

程序员的三板斧

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值