【大数据各平台组件搭建使用精进】azkaban任务调度(13)

目录

工作流概述

背景

工作流调度工具

Azkaban概述

Azkaban组成结构

Azkaban部署模式

Azkaban的部署

第一种:通用的github项目的下载方式

第二种下载方法,可以有选择性的下载自己需要的版本

安装unzip

解压

zkaban目录介绍

编译

出现错误,提示需要git工具,安装git

重新编译

连接Mysql进行数据初始化

azkaban数据初始化

 导入数据到azkaban数据库中

 Azkaban web服务器配置并登录web ui

Azkaban web服务器配置

 Azkaban exector服务器安装配置

 配置exec服务

查看日志​编辑

激活exector服务

重新启动web服务

访问web UI

登录web


        azkaban工作流调度说白了就是一个脚本模块,把你要做的任务流程都整合到一起不用你自己手动操作了,是一个进阶的大数据模块。

        

工作流概述

背景

一个完整的数据分析系统通常都是由大量任务单元组成,例如shell脚本程序、java程序、mapreduce程序和hive脚本等。各任务单元之间存在时间先后及依赖关系,为了将这复杂的执行计划组织起来,需要一个工作流调度系统来调度执行。

工作流调度工具

Azkaban

Azkaban是由Linkedin公司开源的一个批量工作流任务调度器,用于在一个工作流内以一个特定的顺序运行一组工作和流程。

Oozie

Oozie是Apache旗下的,用于管理Hadoop任务的工作流/协调系统,可与Hadoop生态圈紧密结合,提供诸多配置和功能。

Azkaban概述

Azkaban组成结构

Azkaban工作流管理器由三个核心部分组成,分别是Relational Database(关系型数据库MySQL)、AzkabanWebServer(Web服务器)、AzkabanExecutorServer(执行服务器)。三者关系具体如图所示。

 

Azkaban部署模式

solo-server mode(独立服务器模式)

在独立服务器模式下,使用的数据库是内嵌的H2,并且web server和executor server都在同一进程中运行,通常适用于小规模测试阶段。

two server mode(双服务器模式)

双服务器模式适用于比较复杂的生产环境,它的数据库会由具有主从设置的MySQL实例提供支持。其中,Web服务器和执行服务器应在不同的进程中运行,以便升级和维护过程中不影响用户。

distributed multiple-executor mode(分布式多执行器模式)

分布式多执行器模式适用于特别复杂的生产环境,理想情况下,Web服务器和执行服务器应在不同的主机中运行,以便升级和维护不影响用户。这种分布式多主机设置的模式为Azkaban带来了强大且可扩展的性能。

Azkaban的部署

下载

 两种下载方法

第一种:通用的github项目的下载方式

 

 

第二种下载方法,可以有选择性的下载自己需要的版本

这是3.90那版的网盘链接

https://pan.baidu.com/s/1-0zwYz_DtUQP38pVI9MW0w?pwd=1234

  提取码:1234

 

 

 我自己用的是master版本的

连接在这

https://pan.baidu.com/s/15qTkrgnK2Li7ZGKglqFM-A?pwd=1234

  提取码:1234

上传到虚拟机

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

星欲冷hx

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值