Azkaban任务流批量修改调优参数

一、背景

在azkaban调度流程中,flow(工作流)可能经常由于机器性能,如网络、内存、cpu负载等问题导致当时那个时间点下任务执行不成功。
如果没有添加任务失败的重试机制,则下游的flow因上游失败而无法获取执行机会,换言之,调度失败的flow及其之后的flow都将无法正常执行。

比如ETL流程中的sqoop数据抽取脚本,假如一个库中有50个表需要抽取,如果用户为该调度配置了50个flow,则由于上述不可控的原因,造成中间某些节点执行中断,则中断节点及其之后的节点都将执行失败。

如果在失败后,我们能添加一些重试参数,则可以较大幅度的提升任务的稳健性,通过设置合适的重试次数与重试间隔,则任务成功的概率会较大幅度提升。

二、常见的失败重试参数

调优参数说明单位
retries失败的job的自动重试的次数次数
retry.backoff180000毫秒

三、按flow逐项修改

如下所示:
在这里插入图片描述
在这里插入图片描述

四、批量修改

步骤1:下载配置文件

在这里插入图片描述

步骤2:批量修改配置文件

azkaban_params_tuningng_script.sh 代码清单:

代码实现目标:

  • 1、将上述下载并解压的调度文件批量进行配置参数的插入;
  • 2、执行位置进行执行(如3a表示在第三行之后插入调优项);
  1 #!/bin/bash
  2 
  3 AZKABAN_PATH=./azkaban_project_demo
  4 
  5 ls $AZKABAN_PATH|while read f;do
  6     echo $AZKABAN_PATH/$f
  7     #echo -e '\nretries=5\n' >> $f;
  8     #echo 'retry.backoff=180000' >> $f;
  9 
 10     sed -i "3aretries=5" $AZKABAN_PATH/$f
 11     sed -i "4aretry.backoff=180000" $AZKABAN_PATH/$f
 12 done

替换完成后,再重新打包成zip包:

yum -y install zip
zip -r AFTER_TUNING_PARAMS.zip ./azkaban_project_demo

步骤3:上传覆盖原配置文件

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值