Azkaban:最受欢迎的工作流定时调度器

1、理论基础 

1、azkaban是什么?
    azkaban是一个工作流定时调度器,可以解决hadoop jobs的作业依赖问题,使相互依赖的job按顺序执行。

2、azkaban的特点?
    a.兼容所有版本的hadoop。
        这一点与oozie不同,oozie严格依赖hadoop的版本。
    b.易于使用的web页面。
        比oozie功能更强大,更好使用。
    c.丰富的工作流类型并支持自定义。
    d.安全的认证及权限控制。
    e.配置电子邮件提醒。

3、azkaban的基础架构
    web server:
        工作流系统的主要管理者。
        负责用户登录认证,project管理,定时调度,监控等功能。
    executor server:
        负责工作流的提交和执行,通过mysql来协调任务的执行。
    mysql:
        存储大部分执行流的状态,web server和executor server都需要访问mysql。


4、使用步骤
    a.以配置文件的形式定义好工作流。
    b.通过web页面上传到azkaban上,配置文件存储在mysql中。
    c.配置定时调度。
    d.达到调度时间节点,executor server到mysql中读取配置文件,然后将数据下载到本地。
    f.executor server开始执行工作流,并将执行的状态信息不断地放入mysql中。web server可以查看状态信息。
    

2、azkaban的部署

1、安装包
    azkaban-web-server-2.5.0.tar.gz
    azkaban-executor-server-2.5.0.tar.gz
    azkaban-sql-script-2.5.0.tar.gz
        #这就是一个sql脚本,全是建语句。azkaban会用到mysql中的一些表,这些表需要手动创建。
    mysql-libs.zip
        
2、安装
    a.创建目录
        mkdir -p /opt/apps/azkaban && mkdir  /opt/source && cd /opt/source 
    b.解压
        tar -zxvf azkaban-web-server-2.5.0.tar.gz -C ../apps/azkaban 
        tar -zxvf azkaban-executor-server-2.5.0.tar.gz -C ../apps/azkaban
        tar -zxvf azkaban-sql-script-2.5.0.tar.gz -C ../apps/azkaban
    c.改名
        cd /o
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

二百四十九先森

你的打赏是我努力的最大动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值