SQL之开窗函数

SQL之开窗函数

开窗函数与聚合函数一样,也是对行集组进行聚合计算,但是它不像普通聚合函数那样每组只返回一个值,开窗函数可以为每组返回多个值,因为开窗函数所执行聚合计算的行集组是窗口。

主要语法:over( PARTITION BY (根据某条件分组,形成一个小组)….ORDER BY(再组内进行排序) … )

下面是样例:
创建表:

create table Student
(
  Name  VARCHAR2(32),
  Subjects VARCHAR2(32),
  Score VARCHAR2(32)
);

插入测试数据:

insert into Student values ('小明', 'Chiness', '90');
insert into Student values ('小芳', 'Chiness', '91');
insert into Student values ('小新', 'Chiness', '89');
insert into Student values ('小田', 'Chiness', '80');
insert into Student values ('小丽', 'Chiness', '95');
insert into Student values ('小明', 'Math', '100');
insert into Student values ('小芳', 'Math', '86');
insert into Student values ('小新', 'Math', '99');
insert into Student values ('小田', 'Math', '80');
insert into Student values ('小丽', 'Math', '60');
insert into Student values ('小明', 'English', '70');
insert into Student values ('小芳', 'English', '88');
insert into Student values ('小新', 'English', '96');
insert into Student values ('小田', 'English', '81');
insert into Student values ('小丽', 'English', '79')

实验:假如现在要查询成绩小于85的有多少人,并在每行中都显示成绩小于85的学生人数。

1、可能有人会这么写

select t.subjects,count(*) from student t where t.score<85;

但这样写语句执行肯定会报错,因为count()是聚合函数,而subjects字段没有包含分组里面。

2、那换个写法呢?

select t.subjects,count(*) from student t where t.score<85 group by t.subjects;

在这里插入图片描述
这样查询与我们每行中都显示成绩小于85的学生人数不太相符
3、使用子查询

select a.name,a.subjects,(select count(*) from student t where t.score<85) from  student a where a.score<85;

这么写出来的结果的确是我们想要的结果,但多了个子查询总感觉还是很麻烦。
在这里插入图片描述
4、使用开窗函数,它可以大大简化这一实现

select t.name,t.subjects, count(*) over() from student t where t.score < 85;

执行结果:
在这里插入图片描述
可以看到这个SQL语句与平常写的语句不同的是我们在count()后面加了一个over关键字。
总结:
over关键字表示把函数当成开窗函数而不是聚合函数,SQL标准允许将所有聚合函数用做开窗函数,使用over关键字来区分这两种用法。
开窗函数的基本格式为:
函数名(列)over(选项)
例如在上面的例子,开窗函数count(
) over()对于查询结果的每一行都返回所有符合条件的行的记录,over关键字后的括号中还经常添加选项用以改变进行聚合运算的窗口范围,如果over关键字后的括号中选项为空,则开窗函数会对结果集中的所有行进行聚合运算。
当然over当中也可以设置很多条件,来改变开窗的范围和规则
语法:主要是over( PARTITION BY (根据某条件分组,形成一个小组)….ORDER BY(再组内进行排序) …. )
常用函数:

1、row_number() over(partition by … order by …) 
增加一列,类似与增加伪列 
2、rank()  over(partition by … order by …) 
3、dense_rank()  over(partition by … order by …) 
          rank(): 跳跃排序,如果有两个第一级时,接下来就是第三级。 
          dense_rank(): 连续排序,如果有两个第一级时,接下来仍然是第二级。 
4、count() over(partition by … order by …) 
5、max() over(partition by … order by …) 
6、min() over(partition by … order by …) 
7、sum() over(partition by … order by …) 
8、avg() over(partition by … order by …) 
9、first_value() over(partition by … order by …) 
10、last_value() over(partition by … order by …) 

例如:需要通过分组查询取最大值
因通过group by进行分组查询,select查询的字段除聚合函数之外的字段,group by 中的字段都要列出,且除此以外的字段查询放在select中都会报错,故通过group by进行分组实现取最大值的功能比较困难,这时候就可以使用开窗函数。
示例模板:

select * from 
(select t.*, row_number() over(partition by 分组字段 order by 排序字段 desc ) rn
from tablename t )
where rn=1
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
开窗函数在Spark SQL中是一种用于对结果集进行分析和聚合计算的功能。它可以对结果集按照指定的分区进行分组,并在每个分组中进行聚合计算。开窗函数在解决一些复杂的问题时非常有用,可以简化SQL语句的编写,并提高查询效率。 Spark SQL中的开窗函数可以通过使用窗口规范来定义,窗口规范包括分区和排序的规则。分区规则用于将结果集划分为不同的分组,而排序规则用于在每个分组中确定计算的顺序。 通过使用开窗函数,您可以在同一SELECT语句中同时使用多个开窗函数,并且它们之间不会相互干扰。例如,您可以使用COUNT函数来计算每个分组中的记录数,或者使用RANK函数来计算每个分组中的排名。 以下是一个使用Spark SQL开窗函数的示例: ```spark sparkSession.sql("SELECT name, class, score, COUNT(name) OVER(PARTITION BY class) AS name_count1 FROM score").show() sparkSession.sql("SELECT name, class, score, COUNT(name) OVER(PARTITION BY score) AS name_count2 FROM score").show() ``` 在这个示例中,第一个SELECT语句使用COUNT函数,按照班级进行分组,并计算每个班级中的学生数量。第二个SELECT语句使用COUNT函数,按照分数进行分组,并计算每个分数对应的学生数量。 总之,Spark SQL开窗函数是一种强大的工具,可以帮助您对结果集进行灵活的分析和聚合计算。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *3* [Spark SQL开窗函数](https://blog.csdn.net/weixin_39966065/article/details/93099293)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* [Spark SQL——开窗函数](https://blog.csdn.net/weixin_44240370/article/details/103322615)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值