Hive-SQL实现连续多天任务失败的情况

这里写自定义目录标题

问题

任务执行会记录执行情况现在要查询任务连续3天执行失败的情况

思路

  • 使用hive窗口先对任务进行分区,然后按日期进行排序
  • 然后找到任务失败的的第一天,然后通过data_sub函数找到第二天,第三天

SQL实现

  • SQL内容
-- job_id连续 n天 staus = 'FALI' 失败的数据
  select t2.job_id,t2.biz_date,t2.date_diff from
 ( select  t1.job_id,t1.biz_date,date_sub(t1.biz_date,t1.bz) date_diff  from
 	( select *,rank() over (partition by job_id order by biz_date) as bz  from ods.ods_wdp_schedule_bi_scheme_node where  status = 'FAIL' ) t1
 ) t2 
  group by t2.job_id,t2.date_diff,t2.biz_date
   having count(t2.job_id) > 3
  • 注: :hive 需要在每个子查询后面加别名。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值