ETL是数据分析不可缺少的一环,对于ETL的调度管理也是至关重要的。
一个好的ETL调度平台应该具备以下优点:
- 作业集成管理
- 运行监控(WEB监控)
- 异常警告(邮件及短信)
- 日志可查看
- 后台调度
- 系统配置
- 作业执行情况分析界面
探索中发现了ETL调度平台——airflow。airflow 是一个编排、调度和监控workflow的平台,由Airbnb开源,现在在Apache Software Foundation 孵化。airflow 将workflow编排为tasks组成的DAGs,调度器在一组workers上按照指定的依赖关系执行tasks。同时,airflow 提供了丰富的命令行工具和简单易用的用户界面以便用户查看和操作,并且airflow提供了监控和报警系统。
(一)安装