sql开窗函数

开窗函数 over()

简介

窗口函数OVER()指定一组行,开窗函数计算从窗口函数输出的结果集中各行的值。

开窗函数不需要使用GROUP BY就可以对数据进行分组,

还可以同时返回基础行的列和聚合列

聚合函数例如collect_list 也可以在聚合的同时返回基础列

1.当其他列只是收集,不做复杂处理时可以使用聚合+聚合函数

2.需要明细及统计值,而且需要复杂处理使用开窗函数

分类有: 排名开窗函数、聚合开窗函数

-over() 的语法为:over([patition by ] )。需要注意的是,over() 前面是一个函数,如果是聚合函数,那么order by 不能一起使用。

–over() 的另一常用情景是与 row_number() 一起用于分页。

与group 对比

利用over(),将统计信息计算出来,然后直接筛选结果集

declare @t table(
ProductID int,
ProductName varchar(20),
ProductType varchar(20),
Price int)
insert@t
select 1,'name1','P1',3 union all
select 2,'name2','P1',5 union all
select 3,'name3','P2',4 union all
select 4,'name4','P2',4

查询要求:查出每类产品中价格最高的信息

–做法一:找到每个组里,价格最大的值;然后再找出每个组里价格等于这个值的
–缺点:要进行一次join

select t1.* from @t t1
join (select ProductType, max(Price) Price from @t group by ProductType)
t2
on t1.ProductType = t2.ProductTypewhere t1.Price = t2.Price
order by ProductType

–做法二:利用over(),将统计信息计算出来,然后直接筛选结果集。
–over() 可以让函数(包括聚合函数)与行一起输出。

;with cte as(
select *, max(Price) over(partition by (ProductType)) MaxPrice from @t
)
select ProductID,ProductName,ProductType,Price from cte where Price = MaxPriceorder by ProductType

排名开窗函数

ROW_NUMBER、RANK、DENSE_RANK、NTILE 属于排名开窗函数

在spark 中 排名开窗函数必须与ORDER BY 连用,也可以和PARTITION BY同时使用。

PARTITION BY用于将结果集进行分组,开窗函数应用于每一组。

ODER BY 指定排名开窗函数的顺序。在排名开窗函数中必须使用ORDER BY语句。

例如查询每个雇员的定单,并按时间排序

;WITH OrderInfo AS
(SELECT ROW_NUMBER() OVER(PARTITION BY EmployeeID ORDER BY OrderDate) AS Number,OrderID,CustomerID, EmployeeID,OrderDate FROM Orders (NOLOCK)
)
SELECT Number,OrderID,CustomerID, EmployeeID ,OrderDateFrom OrderInfo WHERE Number BETWEEN 0 AND 10

窗口函数根据PARTITION BY语句按雇员ID对数据行分组,然后按照ORDER BY 语句排序,排名函数ROW_NUMBER()为每一组的数据分从1开始生成一个序号。

ROW_NUMBER()为每一组的行按顺序生成一个唯一的序号

RANK()也为每一组的行生成一个序号,与ROW_NUMBER()不同的是如果按照ORDER BY的排序,如果有相同的值会生成相同的序号,并且接下来的序号是不连序的。例如两个相同的行生成序号3,那么接下来会生成序号5。

DENSE_RANK()和RANK()类似,不同的是如果有相同的序号,那么接下来的序号不会间断。也就是说如果两个相同的行生成序号3,那么接下来生成的序号还是4。

NTILE (integer_expression) 按照指定的数目将数据进行分组,并为每一组生成一个序号

聚合开窗函数

很多聚合函数都可以用作窗口函数的运算,如SUM,AVG,MAX,MIN

聚合开窗函数只能使用PARTITION BY子句或都不带任何语句,ORDER BY不能与聚合开窗函数一同使用。

例如,查询雇员的定单总数及定单信息

WITH OrderInfo AS
(
    SELECT COUNT(OrderID) OVER(PARTITION BY EmployeeID) AS TotalCount,OrderID,CustomerID, EmployeeID,OrderDate FROM Orders (NOLOCK)
)
    SELECT OrderID,CustomerID, EmployeeID ,OrderDate,TotalCount From OrderInfo ORDER BY EmployeeID

如果窗口函数不使用PARTITION BY 语句的话,那么就是不对数据进行分组,聚合函数计算所有的行的值

WITH OrderInfo AS
(SELECT COUNT(OrderID) OVER() AS Count,OrderID,CustomerID, EmployeeID,OrderDateFROM Orders (NOLOCK))

许多高级用法

前后移动

找出每个分区的第一条记录类型和最后一条记录类型以及忽略空值

取前n/后n行数据,lag() over()函数和lead() over()函数用法

求数据在分组类的百分数排名

http://www.cppcns.com/shujuku/mssql/229304.html

https://www.jianshu.com/p/fab457f0e779

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值