Airflow学习日记二

本文介绍了Airflow的基本概念,包括DAG、Scheduler、WebServer、Metadata Database和Worker。Scheduler负责监测任务和DAG并触发任务执行,而Executor如Sequential、Local、Celery和DaskExecutor则决定了任务的执行方式。Airflow2.0提供了更强大的功能。
摘要由CSDN通过智能技术生成
基本概念

一个DAG=很多个task

  • Scheduler / 调度器
      是一种使用DAG定义结合元数据中的任务状态来决定哪些任务需要被执行以及任务执行优先级的过程。通常作为服务运行。
  • WebServer / Web服务器
      提供图形界面,可以监控DAG运行状态,也可对DAG操作。使用的是Gunicorn框架。
  • Metadata Database / 元数据库
      默认为SQLite,可以支持MySQL,PostgreSQL。存储所有的DAG,任务定义,运行的历史,用户,权限等等。
  • Worker
      用来执行Executor接收的任务。这些是实际执行任务逻辑的进程,由正在使用的执行器确定。
  • Scheduler

  The Airflow scheduler monitors all tasks and DAGs, then
triggers the task instances once their dependencies are complete. Behind the scenes, the scheduler spins up a subprocess, which monitors and stays in sync with all DAGs in the specified DAG directory. Once per minute, by default, the scheduler collects DAG parsing results and checks whether any active tasks can be triggered

  监视所有任务和 DAG,然后在任务实例的依赖关系完成后触发任务实例。在后台,计划程序启动一个子进程,该子进程监视指定 DA

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值