Hadoop集群使用的是CDH6.3.2,在使用Oozie进行工作流调度的时候,任务失败之后不会重试,有时候失败原因是一个偶然因素,如果任务重试,应该可以执行成功,但是Oozie默认没有启用任务失败重试,需要自己配置启用。
本文描述如何启用Oozie的任务重试功能。
一、配置Oozie
进入Cloudera Manager,导航到Oozie 配置页。
找到 oozie-site.xml 的 Oozie Server 高级配置代码段(安全阀),添加如下配置:
名称 | 值 |
---|---|
oozie.service.LiteWorkflowStoreService.user.retry.error.code.ext | ALL |
配置如图:
重启服务。
注意,经过测试,如果不设置以上配置,在工作流任务中设置失败重试配置是不生效的。
二、设置工作流任务
工作流的每个任务节点可以单独设置任务失败重试策略,默认不重试。
以 Hive2 Action 为例,设置任务失败重试3次,重试间隔1分钟。
1、打开任务配置
2、任务属性默认配置
重试设置中,包含两个配置项:
- Max:最大重试次数。
- 间隔:重试间隔时间,单位分钟。
3、设置重试策略
分别点击 Max + 和 间隔 +,设置重试3次,重试间隔时间1分钟,如图:
这样,Oozie工作流的任务重试配置就生效了。