1、概述
azkaban是一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的key:value对的方式,通过配置中的dependencies 来设置依赖关系。Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。
2、结构
3、启动和关闭
//executor
azkaban/executor/bin/azkaban-executor-start.sh
azkaban/executor/bin/azkaban-executor-shutdown.sh
//web-server
azkaban/server/bin/azkaban-web-start.sh
azkaban/server/bin/azkaban-web-shutdown.sh
注意:先执行executor,再执行web,避免Web Server会因为找不到执行器启动失败
4、简单案例
mapreduce.job
type=command
command=/opt/module/hadoop-2.7.2/bin/hadoop jar /opt/module/hadoop-2.7.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /wordcount/input /wordcount/output
打包上传执行