SparkSQL中纵向迭代计算的3种方式,枚举、python的for循环、pandas_UDF函数(附案例)

需求:计算c4的逻辑:当 c2 = 1,则 c4 = 1;否则 c4 = (上一个 c4 + 当前的 c3) / 2

1、用枚举方式:

--准备数据
create or replace view test2(c1,c2,c3,c4) as values
(1,1,6,1),
(1,2,23,null),
(1,3,8,null),
(1,4,4,null),
(2,1,32,1),
(2,2,9,null),
(2,3,15,null),
(2,4,8,null);

select * from test2;
set spark.sql.shuffle.partitions=4;
select c1, c2, c3,
       case when c2=1 then 1
           else (lag(c4) over (partition by c1 order by c2)+c3)/2
       end    as c4
from test2;
--使用枚举的方式
--计算当c2=2时 ,c4=?
create or replace temporary view test_c2 as
    select c1, c2, c3,
           if(c2=2,(lag(c4) over (partition by c1 order by c2)+c3)/2,c4) as c4
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

奇迹虎虎

客官,赏个银子吧,别下次一定了

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值