Azkaban是数据流引擎,解决作业之间的依赖关系,挺不错的
有三大组件
①Relational Database(Mysql)
用于存储项目、日志或者执行计划之类的信息
②AzkabanWebServer
使用Jetty对外提供web服务,使用户可以通过web页面方便管理
③AzkabanExecutorServer
负责具体的工作流的提交、执行
Azkaban各组件之间的交互图
----------------------------------------------------------------------------------------------------
有时间会具体写一下Azkaban的应用^_^
可以配合hive,shell脚本,sql脚本使用
我已经安装好Azkaban和它的插件azkaban-jobtype-2.5.0,可以看我前面的文章
上图是我写的一些文件,执行顺序如下createHiveTable-->......--->download