AIRFLOW使用总结

由于机器学习各流程时长较长,并且流程比较复杂,经过选型对比,决定选用airflow作为流程调度器

一、选型对比

网上有较详细的各种流程调度器特性对比:https://www.jdon.com/workflow/Airflow-vs-Azkaban-vs-Conductor-vs-Oozie-vs-Amazon-Step-Functions.html 

个人选择airlfow作为机器学习流程调度器主要原因是:python代码调试修改非常方便,特别适合流程较长,容易出问题,需要紧急修复的系统

二、部署架构

  

 

 

1)整个服务以微服务的方式部署在K8s上面,借助k8s调度器保证Scheduler、web挂掉以后自动重新拉起

2)需要共享存储保证worker、rabbitmq集群挂掉以后重启数据不丢失

三、基本使用方式

1)定义DAG

default_args = {
    'owner': 'airflow',
    'depends_on_past': False,
    'start_date': datetime(2015, 6, 1),
    '
  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值