oozie任务失败后如何重新运行

当oozie任务因源数据路径改变而失败时,需要更新job.properties.template的日志路径,并在target目录下放置jar包。通过设置oozie并发性,可以加速数据的追溯处理。在修改配置并确保jar包是最新的情况下,使用oozie命令重启任务,如需追溯特定时间段数据,可单独启动新的oozie任务。注意避免在运行中修改配置文件,以防不一致问题。
摘要由CSDN通过智能技术生成

背景

spark处理的原始日志路径修改了,导致原有的报表处理的源数据找不到路径

需要重新启动oozie任务,并把过去几天丢失的数据补回来

 

# 第一个参数是每个模块的文件夹名

sh -x start_oozie_module.sh detail_report 2019-01-10T15:00 2111-01-01T00:00

今天是14号,从20190110 14:00之后的数据都需要追溯

那我启动oozie时的启动时间就选用这个

 

操作步骤如下:

在job.properties.template中修改日志路径,这个是全局有效的

然后在target建立detail_report目录,将jar包扔进去

启动oozie

spark每处理五分钟的数据大概需要五分钟,所以oozie的concurency可以设置高一些,相当于多线程执行

相当于在控制台开了多个窗口,同时提交spark任务

 

同事之前在oozie上传之后的hdfs目录下直接修改配置文件,类似给飞行中飞机换发动机

他说这样是可行的,但我这次修改concurency,新启动的任务也没有使用到这个新参数

最后还是用oozie命令重启了

注意重启之前,把原来的先杀掉,命令如下

oozie job -oozie http://ip:12000/oozie/ -kill 0130294-181213175815402-oozie-hado-C

 

另外对于同一个模块,也可以用oozie命令启动多个

比如线上正在运行一个oo

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值