SparkSql窗口函数源码分析(第一部分)

这篇梳理一下sparksql实现窗口函数用到的类。

select  
    a,
    row_number() over(partition by a order by b desc ) as rn 
from testdata2

上面的语句主要分两部分

  • window函数部分(row_number)

  • 窗口定义部分(over)

    select  
        a,
        row_number() over(partition by a order by b desc ) as rn 
    from testdata2
    ​
    --------unresolved logical plan--------
    'Project ['a, 'row_number() windowspecdefinition('a, 'b DESC NULLS LAST, unspecifiedframe$()) AS rn#10]
    +- 'UnresolvedRelation [testdata2], [], false

    从执行计划能够了解到sparksql描述窗口函数时用到的类的结构。

    窗口函数的类结构

 WindowExpression :描述该expression是一个windowExpression,继承BinaryLike,是一个二元树。

1、window函数部分--windowFunction

windows函数部分就是所要在窗口上执行的函数。

WindowFunction

  • AggregateWindowFunction  --聚合函数、分析窗口函数(Analytic functions)cume_dist函数计算当前值在窗口中的百分位数

  • OffsetWindowFunction --位移(lag、lead),非聚合函数

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小萝卜算子

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值