Airflow

airflow 是一个使用python语言编写的data pipeline管理、调度和监控工作流的平台

DAG:

  • 多个task的集合,定义了这些task间的执行顺序和依赖关系。
  • 定义在python文件中,airflow会执行每一个文件,动态构建出DAG对象,每一个DAG对应一个workflow。在airflow动态构建过程中,发现DAG满足触发条件,则生产当前execution date的DAG运行实例(DAG RUN)

task和opeartor:

  • task是operator的一个实例,也是DAGs中的一个node
    • operator描述了task的类型,不同operator可以用来完成不同类型的task;一个operator定义一个task,每个operator独立执行,如:
      • HiveOperator:执行Hive SQL,通常是执行ETL,将数据运算提取后写入目标
      • HivePartitionSensor:检测Hive表中的某个分区是否存在
      • PythonOperator:执行Python脚本

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值