Azkaban任务动态参数小结

本文介绍了如何使用Azkaban进行数据仓库的任务调度,包括每日业务数据库到数仓的数据同步、清洗和指标计算。通过编写不同job依赖关系实现任务顺序执行,并展示了如何通过动态参数传递,如利用shell脚本将日期写入文件,再由后续任务读取,以适应不同日期的同步需求。此外,还详细解析了Azkaban的参数传递和输出机制。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 数仓任务调度案例

每日凌晨,我们会将业务数据库同步到数仓中,并进行清洗和相关指标的计算,然后导出到PostgreSQL中给业务系统使用,整个过程可以通过Azkaban进行调度执行。

  • job编写

    job内容是执行对应的shell脚本,执行对应的任务,比如hive的脚本等。job的执行顺序依靠dependencies来描述,A 依赖B,则B先执行。

    多个依赖用逗号分隔。
    在这里插入图片描述

    import_log.job

    type=command
    do_date=${dt}
    command=/root/bin/sqoop_import_mp_log.sh all ${do_date}
    

    import_user.job

    type=command
    do_date=${dt}
    command=/root/bin/sqoop_import_mp_user.sh all ${do_date}
    

    ods.job

    type=command
    do_date=${dt}
    dependencies=import_log,import_user
    command=/root/bin/ods_db.sh  ${do_date}
    

    dwd.job

    type=command
    do_date=${dt}
    dependencies
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值