SQL:统计每5min在线人数思路

需求如下:

目前有表:

用户开始游戏时间和游戏结束时间

如:         

用户id游戏开始时间 游戏结束时间
0000012022-06-01 00:36:332022-06-01 00:54:08

需要得到的数据:

时间时刻在线人数
2022-06-0100:00:0020
2022-06-0100:05:0022
2022-06-0100:10:0024
......
2022-06-3000:55:0020

每天每个小时有12条记录

思路:

 

可以看到 开始时间和结束时间判断对应的时间点是否在线的规则是不一样的。

判断游戏时长大于1h的为异常数据,已经过滤了游戏耗时大于1h的数据,所以目前数据的情况是

1,游戏开始时间和结束时间是在同一天,同一个小时内;

2,游戏开始时间和结束时间是同一天,不同小时内;

3,游戏开始时间和结束时间不是同一天,不同小时内;

故将以上三种情况做分析:

情况1:游戏开始时间和结束时间是在同一天,同一个小时内,则只需要膨胀游戏的开始时间得到相对应的时间点,再判断,这个点是否在开始时间和结束时间的区间内

 

情况2和情况3是一样的:游戏的开始时间和结束时间都需要分别去做膨胀,然后再去判断这个点是否在开始时间和结束时间的区间内 ,膨胀后的数据union all

最后把 以上两个 情况得到的结果 union all

SQL编写:

根据这两种情况去做写sql

从上思路中发现,我们需要先创建一个一小时12个点的表:

00:00,00:05,00:10,00:15,00:20,00:25,00:30,00:35,00:40,00:45,00:50,00:55

可以从现有的这个表去创造

用floor()函数去判断,当前这个分钟属于哪个点 如 04分

floor(4/5)=0 ,floor(6/5)=1,floor(12/5)=2... 以此类推可以得到上面的点

create table time_table as 

select hour

, case 

when level = '0'  then '00:00'

when level = '1'  then '05:00'

when level = '2'  then '10:00'

when level = '3'  then '15:00'

when level = '4'  then '20:00'

when level = '5'  then '25:00'

when level = '6'  then '30:00'

when level = '7'  then '35:00'

when level = '8'  then '40:00'

when level = '9'  then '45:00'

when level = '10' then '50:00'

when level = '11' then '55:00'

end as min

from 

(

       select 

                substr(start_time,12,2) as hour

               ,floor(substr(start_time,15,2) / 5 ) as level

       from table_a 

    where dayno>=20220601 

         and dayno<=20220630

     group by 1,2

) t1

得到时间表之后,和源表关联

第一种情况

只需要关联开始时间的hour就可以,因为开始和结束时间都是同一个hour下,这样关联每一条记录会膨胀12条数据

t1 join t2

on    t1.hour = substr(t2.start_time,12,2)

聚合条件为

sum(case 
when unix_timestamp(point) - unix_timestamp(start_time) >= 0 and  unix_timestamp(point) - unix_timestamp(over_time) <= 0 then 1
else 0
end) as online_user

第二种情况

需要分成两段(开始时间一段,结束时间一段),然后再把两段union all起来

开始时间的关联

t1 join t2

on    t1.hour = substr(t2.start_time,12,2)

聚合条件为

sum(case 
when unix_timestamp(point) - unix_timestamp(start_time) >= 0 then 1
else 0
end) as online_user

结束时间的关联:

t1 join t2

on    t1.hour = substr(t2.over_time,12,2)

聚合条件为

sum(case when 
unix_timestamp(over_time) - unix_timestamp(point) >= 0 then 1
else 0
end) as online_user

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值