hive sql: 带有 max() 的 case 语句

我有一个日期列yyyy_mm_dd。我想使用以下逻辑基于它创建一个附加列:

  1. 如果 yyyy_mm_dd = 一个月的最后一天,则 1
  2. 如果 yyyy_mm_dd 不是该月的最后一天而是数据集中的最大日期,则为 1
  3. 否则为 0

我能够想出这个,它适用于逻辑的第 1 部分和第 3 部分:

select
    *,
    case
        when yyyy_mm_dd == last_day(yyyy_mm_dd) then 1
        when yyyy_mm_dd != last_day(yyyy_mm_dd) then 0
    end as last_day_of_month
from
    my_table
where
    yyyy_mm_dd is not null

这很有效,然后我尝试为最终逻辑添加以下内容:

when (yyyy_mm_dd == last_day(yyyy_mm_dd) or yyyy_mm_dd == max(yyyy_mm_dd)) then 1

但是它报错了:

Expression not in GROUP BY key id

有什么办法可以实现这个“月份的最后一天或最大日期”标志?我不想要每组的 max_date,而是整个数据集中的最大日期

不说废话,上方法:
使用子查询和解析函数计算最大值。max(yyyy_mm_dd) over()将返回数据集中的最大值并且不需要分组依据。

select
    t.*, --list columns here
    case
        when (yyyy_mm_dd == last_day(yyyy_mm_dd) or yyyy_mm_dd == max_dt ) then 1
        else 0
    end as last_day_of_month
from
(
	select 
    	t.*, 
    	max(yyyy_mm_dd) over() as max_dt 
    from  my_table t
    where yyyy_mm_dd is not null) t;
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

雾岛与鲸

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值