Oozie系列-Action失败重试,不生效排查

失败重试

问题描述

项目中配置了 retry-max=“3” retry-interval=“2” 但是任务error并不重试。
workflow的xml配置如下

<workflow-app name="etl_ds_hive2_action-${etl_name}" xmlns="uri:oozie:workflow:0.5">
    <start to="hive2_action"/>
    <kill name="Kill">
        <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill> 
    <action name="hive2_action" cred="hive2" retry-max="3" retry-interval="2" >
        <hive2 xmlns="uri:oozie:hive2-action:0.1">
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <configuration>
                <property>
                    <name>oozie.launcher.mapred.job.queue.name</name>
                    <value>${launcher_queue}</value>
                </property>
                <property>
                    <name>mapreduce.job.queuename</name>
                    <value>${mapreduce_queue}</value>
                </property>
            </configuration>
            <jdbc-url>${hiveServerUrl}?mapred.job.queue.name=${mapreduce_queue}</jdbc-url>
            <password>${p}</password>
            <script>/user/jwth/etl_ds/etl/86/11718.hql</script>
            <param>biz_date=${biz_date}</param>
            <param>var_date=${var_date}</param>
            <param>var_date=${var_date}</param>
        </hive2>
        <ok to="End"/>
        <error to="Kill"/>
    </action>
    <end name="End"/>
</workflow-app>

问题排查

查询官方文档后发现,默认尝试的 error code 只有几个
在这里插入图片描述在这里插入图片描述

问题解决方案

配置 oozie.service.LiteWorkflowStoreService.user.retry.error.code.ext=ALL
如果你使用 CM 管理CDH 可在界面如下操作配置
在这里插入图片描述
在这里插入图片描述

总结

之前没有认真阅读官方文档,以为配置了retry-max=和 retry-interval action 就会自动重试,阅读后才发现

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值