SQL2005学习笔记-窗口函数(OVER)

1.简介: 
SQL Server 2005中的窗口函数帮助你迅速查看不同级别的聚合,通过它可以非常方便地累计总数、移动平均值、以及执行其它计算。
窗口函数功能非常强大,使用起来也十分容易。可以使用这个技巧立即得到大量统计值。
窗口是用户指定的一组行。 开窗函数计算从窗口派生的结果集中各行的值。

 

2.适用范围:
排名开窗函数和聚合开窗函数.
也就是说窗口函数是结合排名开窗函数或者聚合开窗函数一起使用
OVER子句前面必须是排名函数或者是聚合函数

3.例题:


-- 建立订单表
create   table  SalesOrder(
OrderID 
int ,             -- 订单id
OrderQty  decimal ( 18 , 2 )   -- 数量
)
go

-- 插入数据
insert   into  SalesOrder
select   1 , 2.0
union   all
select   1 , 1.0
union   all
select   1 , 3.0
union   all
select   2 , 6.0
union   all
select   2 , 1.1
union   all
select   3 , 8.0
union   all
select   3 , 1.1
union   all
select   3 , 7.0
go

-- 查询得如下结果
select   *   from  SalesOrder
go

OrderID     OrderQty
-- --------- ------------
1             2.00
1             1.00
1             3.00
2             6.00
2             1.10
3             8.00
3             1.10
3             7.00

 

 

现要求显示汇总总数,每当所占比例,分组汇总数,每单在各组所占比例,要求格式如下:

OrderID OrderQty 汇总     每单比例 分组汇总 每单在各组比例
1            2.00     29.20        0.0685      6.00           0.3333
1            1.00     29.20        0.0342      6.00           0.1667
1            3.00     29.20        0.1027      6.00           0.5000
2            6.00     29.20        0.2055      7.10           0.8451
2            1.10     29.20        0.0377      7.10           0.1549
3            8.00     29.20        0.2740      16.10         0.4969
3            1.10     29.20        0.0377      16.10         0.0683
3            7.00     29.20        0.2397      16.10         0.4348


-- 利用窗口函数和聚合开窗函数,可以很快实现上述要求
select  OrderID,OrderQty,
sum (OrderQty)  over ()  as   [ 汇总 ] ,
convert ( decimal ( 18 , 4 ), OrderQty / sum (OrderQty)  over () )  as   [ 每单所占比例 ] ,
sum (OrderQty)  over (PARTITION  BY  OrderID)   as   [ 分组汇总 ] ,
convert ( decimal ( 18 , 4 ),OrderQty / sum (OrderQty)  over (PARTITION  BY  OrderID))  as   [ 每单在各组所占比例 ]
from  SalesOrder
order   by  OrderID


窗口函数是sql2005新增加的,下面我们看看在sql2000里面怎么实现上述的结果:
sql2000的实现步骤较麻烦,先计算出总数,再分组计算汇总,最后连接得到结果

-- sql2000
declare   @sum   decimal ( 18 , 2 )
select   @sum = sum (OrderQty) 
from  SalesOrder

-- 按OrderID,计算每组的总计,然后插入临时表
select  OrderID, sum (OrderQty)  as  su
into  #t
from  SalesOrder
group   by  OrderID

-- 连接临时表,得到结果
select  s.OrderID,s.OrderQty,
    
@sum   as   [ 汇总 ] ,
    
convert ( decimal ( 18 , 4 ),s.OrderQty / @sum as   [ 每单所占比例 ] ,
    t.su  
as   [ 分组汇总 ] ,
    
convert ( decimal ( 18 , 4 ),s.OrderQty / t.su)  as   [ 每单在各组所占比例 ]
from  SalesOrder s  join  #t t
on  t.OrderID = s.OrderID
order   by  s.OrderID

drop   table  #t
go


上面演示的都是窗口函数与聚合开窗函数的使用,它与排名开窗函数请看下面例题:


-- 与排名开窗函数使用
select  OrderID,OrderQty,
rank() 
over (PARTITION  BY  orderid  order   by  OrderQty )  as   [ 分组排名 ] ,
rank() 
over ( order   by  OrderQty )  as   [ 排名 ]
from  SalesOrder
order   by  orderid  asc

-- 查询得如下结果
OrderID    OrderQty    分组排名    排名
1          2.00          2          4
1          3.00          3          5
1          1.00          1          1
2          1.10          1          2
2          6.00          2          6
3          7.00          2          7
3          8.00          3          8
3          1.10          1          2
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: Spark SQL中的窗口函数over partition by是一种用于对数据进行分组计算的函数。它可以将数据按照指定的列进行分组,并在每个分组内进行计算。这种函数在数据分析和处理中非常常见,可以帮助我们更方便地进行数据聚合和统计。 ### 回答2: Spark SQL窗口函数是一种强大的函数,可以对窗口内的数据进行分组聚合、排序、排名、分析计算等操作。在实际的数据处理过程中,常常会遇到需要对数据进行分组、聚合等操作的场景,这时候,窗口函数就可以发挥重要作用。 Over partition by是spark sql窗口函数中的一种非常强大的函数,能够对指定字段进行分组聚合。在使用over partition by时,需要定义一个窗口,即用来指定数据的分组方式。通常情况下,partition by子句用来指定需要分组的字段,over子句则用来执行数据计算的操作。 例如,如果需要计算一组数据不同时间点的总和,则可以使用over partition by函数来实现。首先,在select子句中指定需要计算的字段,然后使用over partition子句指定分组方式,最后使用sum函数计算总和。如下所示: ``` SELECT time,value,sum(value) over (partition by time) FROM table_name; ``` 上述示例中,partition by子句使用time字段进行分组,然后将value字段用于计算每个分组的总和。 除了上述示例中的聚合操作,Spark SQL中的over partition by函数还可以执行窗口排序、排名、累计计算、百分比计算等多种计算操作。例如,使用over partition by函数来实现窗口排序,则可以使用排列相关的函数,如rank、dense_rank、row_number等。 总结来说,Spark SQL中的over partition by函数是一种非常强大的窗口函数,可以在数据处理过程中实现复杂的分组、排序、排名、累计计算、百分比计算等多种计算操作。对于需要对数据进行多重分组、聚合分析的场景,使用over partition by函数可以非常方便地实现数据分析处理的任务。 ### 回答3: Spark SQL中的窗口函数over partition by是一种用于在查询结果集中处理数据的功能。窗口函数可以在数据中划分子集,执行聚合函数,计算行号等操作。这些操作与简单的分组聚合或排序不同,因为他们不会对查询结果进行分组,而是对子集进行操作,同时保留查询结果集的完整性。 over partition by语法可用于将查询结果集划分为多个分区,然后在每个分区上执行操作。对于每个分区,分配一个排名或数字,允许在对查询结果集进行其他处理之前,对子集进行排序或聚合操作。 over partition by语法的基本语法格式为: SELECT col1, col2, sum(col3) OVER (PARTITION BY col1) FROM table1 以上语句将查询结果集按照col1进行分区,并对每个分区进行col3的聚合操作,最后在每行返回结果集中的col1、col2、col3聚合总和。 over partition by语法中还可以使用其他聚合函数,如avg()、min()、max()等等。同时,还支持rank()、dense_rank()、row_number()、ntile()等其他更高级的分析函数。 over partition by的使用可以帮助我们更好的处理查询结果集中的数据。通过使用这个功能,我们可以轻松地执行各种分析操作,比如打造数据仪表盘、制定分析计划等等。当我们需要比单个分组细化分析数据时,over partition by语法就是非常有用的。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值