hive之求累计值

最近做项目真是忙到昏厥,抽个空写篇博客吧,保持良好的学习习惯~

今天要写的是工作中经常遇到的求累计值的问题。

从订单表中取出orderid,uid,time,ciiamount,数据格式如下:

现需要计算每个uid每天累计的成交金额。

SQL代码如下:

--汇总每个uid每天的订单成交金额
USE edw_htl;
DROP TABLE IF EXISTS tmp_linshi_cumulative_01;
CREATE TABLE tmp_linshi_cumulative_01 as
select uid  
      ,time 
	  ,sum(ciiamount) as total_amount
  from 
   ( select orderid
           ,uid
           ,to_date(orderdate) as time
           ,ciiamount
       from edw_htl.ordersnap
	 ) a 
group by uid,time 

--求累计
--这里采用的思想是对uid、time和total_amount进行分组,然后在对小于等于的天数进行求和。代码如下:
select a.uid
      ,a.time
      ,max(a.amount_tatol) as amount_tatol
      ,sum(b.amount_tatol) as cumulative_amount
from edw_htl.tmp_linshi_cumulative_01 as a 
join edw_htl.tmp_linshi_cumulative_01 as b 
  on a.uid=b.uid
where b.time <= a.time
group by a.uid,a.time

运行结果如下:

假如现在不需要统计到每个用户的情况,就看全量订单,求每天订单的总金额,然后按照天进行累计。此时可以用另外一种方法,代码如下:

 

select a.time
      ,sum(a.total_amount) as total
      ,sum(sum(a.total_amount)) over(order by a.time rows between UNBOUNDED PRECEDING AND CURRENT ROW) cumulative
  from 
   ( select time
           ,sum(ciiamount) as total_amount
       from edw_htl.tmp_linshi_cumulative_01
      group by time
    ) a 
 group by a.time

结果如下:

当然,这种不统计到每个用户的,上面一种方法也是可以实现的,但是上面到每个uid,此种方法就没有效果。

  • 8
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值