【SQL】1661. 每台机器的进程平均运行时间 (四种写法;自连接;case when;窗口函数lead();)

64 篇文章 1 订阅

前述

Sql窗口分析函数【lead、lag详解】
Hive 分析函数lead、lag实例应用

  • lag :用于统计窗口内往上第n行值
  • lead :用于统计窗口内往下第n行值
lead(列名,1,0) over (partition by 分组列 order by 排序列 rows between 开始位置 preceding and 结束位置 following)

lag 和lead 有三个参数:

  1. 列名;
  2. 偏移的offset;
  3. 超出记录窗口时的默认值。

题目描述

leetcode题目:1661. 每台机器的进程平均运行时间

在这里插入图片描述
在这里插入图片描述

Code

写法一:自连接

select A.machine_id,
    round(avg(B.timestamp - A.timestamp), 3) as processing_time
from Activity A, Activity B 
where A.machine_id = B.machine_id and
    A.process_id = B.process_id and 
    A.activity_type = 'start' and
    B.activity_type = 'end'
group by machine_id

过程解析:连表,然后过滤需要的行。

在这里插入图片描述

写法二:同组内最大最小值确定end time和start time

思路转换:同组内的结束时间-开始时间 == max(timestamp) - min(timestamp)

select machine_id,
    round(avg(timm), 3) as processing_time 
from (
    select *,
        max(timestamp) - min(timestamp) as timm 
    from Activity
    group by machine_id, process_id
) A 
group by machine_id

写法三:case when

思路:把 end 时间变成负数,方便求和/平均值计算。

select machine_id,
    round(avg(timm)*2, 3) as processing_time
from (
    select *,
        case 
            when activity_type='end' 
            then timestamp 
            else -timestamp
        end as timm
    from Activity
) A 
group by machine_id

过程解析:

在这里插入图片描述

写法四:窗口函数lead()

with t as(
    select *, 
        lead(timestamp, 1, 0) over(partition by machine_id order by process_id asc, timestamp asc) as end_time
    from Activity
)
select t.machine_id,
    round(avg(end_time-timestamp), 3) as processing_time
from t 
where t.activity_type = 'start'
group by t.machine_id

在这里插入图片描述
在这里插入图片描述
此写法学习大佬的题解 WITH+LEAD窗口函数

  • 33
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值