文章目录
1. 数仓任务调度案例
每日凌晨,我们会将业务数据库同步到数仓中,并进行清洗和相关指标的计算,然后导出到PostgreSQL中给业务系统使用,整个过程可以通过Azkaban进行调度执行。
-
job编写
job内容是执行对应的shell脚本,执行对应的任务,比如hive的脚本等。job的执行顺序依靠dependencies来描述,A 依赖B,则B先执行。
多个依赖用逗号分隔。
import_log.job
type=command do_date=${dt} command=/root/bin/sqoop_import_mp_log.sh all ${do_date}
import_user.job
type=command do_date=${dt} command=/root/bin/sqoop_import_mp_user.sh all ${do_date}
ods.job
type=command do_date=${dt} dependencies=import_log,import_user command=/root/bin/ods_db.sh ${do_date}
dwd.job
type=command do_date=${dt} dependencies