SQL窗口函数练习题(排名问题、topN问题)

** 笔记内容包括SQL窗口函数的介绍、练习题的解答全流程。

窗口函数语法

排名问题:每个部门按业绩来排名
topN问题:找出每个部门排名前N的员工进行奖励

窗口函数语法:

<窗口函数> over (partition by <用于分组的列名>
order by <用于排序的列名>)

<窗口函数>可以放以下两种函数:
1) 专用窗口函数,包括后面要讲到的rank, dense_rank, row_number等专用窗口函数。
2) 聚合函数,如sum. avg, count, max, min等
专用窗口函数
rank, dense_rank, row_number这三个函数的区别如下:
在这里插入图片描述

对表分组
Group by VS partition by用来对表分组
在这里插入图片描述

练习题:双十一分析

  1. 创建一个库 :create database Exercise;
  2. 查看库是否建立成功:show databases;
  3. 使用这个练习库: use Exercise;
  4. 查看库里的表格:show tables;
  5. 创建表格
create table 双十一登陆表(
		id int,
		姓名 varchar(100),
		邮箱地址  varchar(100),
		最后登陆时间 date
		);
  1. 插入信息数据:
insert into 双十一登陆表(id,姓名,邮箱地址,最后登陆时间) values(100, 'test4', 'test@yahoo.cn','2007/11/25 16:31');
insert into 双十一登陆表(id,姓名,邮箱地址,最后登陆时间) values(13,'test1','test@yahoo.cn','2007/3/22 16:27');
insert into 双十一登陆表(id,姓名,邮箱地址,最后登陆时间) values(19,'test1','test@yahoo.cn','2007/10/25 14:13');
insert into 双十一登陆表(id,姓名,邮箱地址,最后登陆时间) values(42,'test1','test@yahoo.cn','2007/10/25 14:20');
insert into 双十一登陆表(id,姓名,邮箱地址,最后登陆时间) values(45,'test2','test@yahoo.cn','2007/4/25 14:17');
insert into 双十一登陆表(id,姓名,邮箱地址,最后登陆时间) values(49,'test2','test@ahoo.cn','2007/5/25 14:22');
  1. 查看表格内容:select * from 双十一登陆表;

  2. 导入数据时还是出现了一些问题处理方法:删除、修改内容
    在这里插入图片描述

  • 删除异常值
delete from 双十一登陆表
where 最后登陆时间 is NULL;
  • 修改错误值
update 双十一登陆表
set 邮箱地址='test@yahoo.cn'
where id=49;

问题1:按时间给出每个人的登录次数,登录时间最早的为1,之后的分别是2,3,4等。

因为是排名问题,所以使用分组(窗口函数partiotion by 姓名),并按最后登录时间升序排列(order by最后登录时间 asc)。

SELECT 姓名,`最后登陆时间`,row_number ( ) over (PARTITION BY 姓名 ORDER BY `最后登陆时间` ASC ) AS 登录时间排名 
 FROM `双十一登陆表`;

在这里插入图片描述

问题2:按天给出每个人的登陆次数,同一天多次登陆认为是同一次,最早标记为1,之后以此类推。

排名问题,要使用窗口函数。因为同一天登陆的记录排名相同,不占用下一名次排名,所以用dense_rank函数

SELECT 姓名,`最后登陆时间`,
			 dense_rank ( ) over (PARTITION BY 姓名 ORDER BY `最后登陆时间` ASC ) AS 登录时间排名 
 FROM `双十一登陆表`;

在这里插入图片描述
发现结果没有变化,其中test1 的登陆时间排名同一天却有两个不同排名。题目要求是登陆天数,所以需要使用date_format(date,format)来转化为时间格式:date_format(最新登陆时间,’%Y%m%d’)

#同一天
SELECT 姓名,`最后登陆时间`,
			 dense_rank ( ) over (PARTITION BY 姓名 ORDER BY date_format(`最后登陆时间`,'%Y%m&d' ) ASC ) AS 登录时间排名 
 FROM `双十一登陆表`;

在这里插入图片描述

1、2答案结果汇总

SELECT 姓名,`最后登陆时间`,
			 row_number ( ) over (PARTITION BY 姓名 ORDER BY `最后登陆时间` ASC ) AS 登录时间排名,
			 dense_rank ( ) over (PARTITION BY 姓名 ORDER BY date_format(`最后登陆时间`,'%Y%m&d' ) ASC ) AS 登录天数排名 
 FROM `双十一登陆表`;

在这里插入图片描述

问题3:找出每个用户第一次登陆的日期。

SELECT *
FROM( 
SELECT 姓名, 最后登陆时间, row_number()over ( PARTITION BY 姓名 ORDER BY `最后登陆时间` ASC ) AS 登录时间排名
	FROM 双十一登陆表 ) AS a 
WHERE
	登录时间排名 = 1;

在这里插入图片描述

通俗易懂的学会:SQL窗口函数:https://zhuanlan.zhihu.com/p/92654574

  • 0
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值