SQL笛卡尔积结合前后行数据的统计案例

SQL前后3天统计分析

问题描述

为什么这段mysql语句能够实现如下功能?

 某市建了一个新的体育馆,每日人流量信息被记录在gymnasium表中:序号 (id)、日期 (date)、 人流量 (visitors_flow)。

请编写一个查询语句,找出人流量处于高峰的记录 id、日期 date 和人流量 visitors_flow,其中高峰定义为前后连续三天人流量均不少于 100。

gymnasium表结构数据如下:

 提示:每天只有一行记录,日期随着 id 的增加而增加。

如上文所示,我的疑问在于既然a,b,c都是一个表的同一个别名,那么where a.visitors_flow>=100 and b.visitors_flow>=100 and c.visitors_flow>=100不就重复了吗?同时,a.id与b.id与c.id不是都相同吗?刚入门,感谢赐教。

 解决方法

--#1 需求描述:前后连续三天人流量均不少于 100。
/*
SQL转换: 找出表里流量大于100的记录且每条(天)的前后都有数据,即都能关联上。
思路演化: 需要通过笛卡尔积生成3张“表”(每张表的visitors_flow>=100),前后连续3天通过id(id是连续的)关联。
*/
--#2 表与数据
CREATE TABLE gymnasium
(
id int,
date DATE,
visitors_flow SMALLINT
)

TRUNCATE TABLE gymnasium;
INSERT INTO gymnasium VALUES(1,'2019-01-01',58);
INSERT INTO gymnasium VALUES(2,'2019-01-02',110);
INSERT INTO gymnasium VALUES(3,'2019-01-03',123);
INSERT INTO gymnasium VALUES(4,'2019-01-04',67);
INSERT INTO gymnasium VALUES(5,'2019-01-05',168);
INSERT INTO gymnasium VALUES(6,'2019-01-06',1352);
INSERT INTO gymnasium VALUES(7,'2019-01-07',382);
INSERT INTO gymnasium VALUES(8,'2019-01-08',326);
INSERT INTO gymnasium VALUES(9,'2019-01-09',99);
INSERT INTO gymnasium VALUES(10,'2019-01-10',73);
INSERT INTO gymnasium VALUES(11,'2019-01-11',65);
INSERT INTO gymnasium VALUES(12,'2019-01-12',123);
INSERT INTO gymnasium VALUES(13,'2019-01-13',28);
--#3 当前SQL解释:
/*
从同一个表“visitors_flow>=100”里取得结果集确实是相同的,加上条件“a.id = b.id-1 and b.id= c.id -1”时筛选了前后连续3天。
注:a.visitors_flow>=100需要在筛选连续3天时加上,而不是在外部。外部的要求更严格,内部的仅要求局部连续3天。
外部的要求更严格(适合连续前后3天访问量大于100),内部的仅要求局部连续3天。
*/

--#4 正确写法:
# Way1
select  DISTINCT a.*
from gymnasium a,gymnasium as b,gymnasium as c
where 
-- (a.visitors_flow>=100 AND b.visitors_flow >=100 AND c.visitors_flow >=100) 
-- and ( 
(a.id = b.id-1 and b.id= c.id -1 AND a.visitors_flow>=100) or 
(a.id = b.id-1 and a.id=c.id -1 AND a.visitors_flow >=100 ) or 
(a.id = b.id+1 and b.id= c.id AND a.visitors_flow >=100) 
  order by a.id; 
-- 注:该结果出来的日期间隔可能超过3。
  
 --#Way2 通过相邻函数lag(前N行),MYSQL8、SQL Server、Oracle都支持。
 SELECT pre_id1,pre_date1,pre_1 as visitors_flow FROM
(
SELECT *,
lag(visitors_flow,1)over(order by id) pre_1,
lag(date,1)over(order by id) pre_date1,
lag(id,1)over(order by id) pre_id1,
lag(visitors_flow,2)over(order by id) pre_2
FROM gymnasium
)A
WHERE pre_1>=100

-- 注:这里取的是有前和后的,第一行和最后一行未包含。
--#5 结果

执行结果

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

ShenLiang2025

您的鼓励是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值