Airflow调度逻辑

开门见山,最重要的是要理解startdate 和 scheduler interval的含义及使用场景。

  1. 在DAG首次开启后会在startdate启动运行
  2. 运行间隔有月/周/天/时/分之分,总体而言airflow会在下个间隔的起始时间调用上个间隔的任务。
  3. 对于连续的调度任务而言:
    • 如果运行间隔为每天,则第二天运行前一天的任务;
    • 如果时间间隔为每小时,则第二小时运行前一小时的任务;
  4. 对于间断性调度的任务:
    • 例如调度间隔为[1,2,5,8,9](小时),则在第二个间隔起始时调用上一个间隔的任务,比如在5点才调用2点的任务,在8点调用5点的任务,在9点调用8点的任务,对于天/小时则以此类推。
      用crontab表达式表示调度间隔更加方便,公式编辑及含义可以在这里实时查看。

参考资料:

  1. https://airflow.apache.org/docs/apache-airflow/1.10.1/scheduler.html
  2. https://towardsdatascience.com/airflow-schedule-interval-101-bbdda31cc463
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值