Azkaban 看这一篇就够了！任务调度平台的搭建，使用，以及API开发

JavaBuilt

于 2020-02-08 16:21:42 发布

阅读量7.7k

点赞数 1

分类专栏：精选博文文章标签： hadoop Azkaban

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JavaBuilt/article/details/104224561

版权

本文详细介绍了Azkaban任务调度平台，包括其与Hadoop的关系、常见任务调度器对比、安装步骤、Web可视化平台的使用及API功能预览，适合需要集成Azkaban进行二次开发的读者。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

写在前面的话

当你的才华还撑不起你的野心时，那你就应该静下心来学习。每次脑子都会有很多
法，每次做了之后，还是觉得需要沉淀下来提升自己更加重要。著名的红叶子理论：一个人职业的成功不在于红叶子的数目多少，而在于他是否具备一片特别硕大的红叶子，这片特别硕大的红叶子不是与生俱来，需要个人的不断努力，准确地识别到最适合发展的红叶子。

本文内容较多，建议关注不迷路，更多优质内容等着你

在这里插入图片描述

目录大纲

0 写在前面的话

1.1 初识Azkaban

1.2 为什么需要任务调度器

1.3 常见几种任务调度器

1.4 Azkaban和Hadoop的关系

1.5 Azkaban 底层原理

2 Azkaban任务调度平台搭建

3 Azkaban Web可视化平台详细介绍以及使用

4 Azkaban API 功能预览

4.1 对接Azkaban，进行二次开发，使其嵌入到系统中

5 平台搭建中的问题总结

1.1 初识Azkaban

起源：Linkedin开源的一个批量工作流调度器
特征：一个工作流内，多个作业可以按照特定的顺序执行
依赖关系：作业之间的顺序关系依靠key-value的形式来建立依赖关系
可视界面：提供可视化web界面

官网：https://azkaban.github.io/

1.2 为什么需要任务调度器

定时任务的出现，可谓大大提高了工作效率。最简单的定时任务，就是你手机的闹钟，你给它一个定时任务，到了指定时间它就叫醒你。程序当中也是如此，那些反复繁琐的操作，可以交给任务调度器去执行，这样既能避免人为的失误，也能让工作人员从无意义的工作中解脱出来！

什么是工作流任务调度器？

很多时候，单一的任务并没有办法满足我们的业务需求，任务直接有关联性，这时候工作流就诞生了！

1.3 常见几种任务调度器

常见的几种工作流任务调度器介绍

Hamake:

描述语言：xml
依赖机制：data-driven
不需要web容器
支持hadoop 作业调度
运行模式：command line utility
事件通知：不支持
无需安装

Oozie

描述语言：xml
依赖机制：explicit
需要web容器
不支持hadoop作业调度
运行模式：daemon
事件通知：不支持
需要安装

Azkaban

描述语言：text file with key/value pairs
依赖机制：explicit
需要web容器
支持Hadoop 作业调度
运行模式daemon
事件通知：不支持
需要安装

Cascading

工作流描述语言：Java Api
依赖机制：explicit
不需要web容器
支持hadoop 作业调度
运行模式 API
事件通知：有
无需安装

市面上最流行的工作流任务调度器大致有以下这两种：

ooize
azkaban

下面就这两种,进行详细的阐述

ooize 偏重

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。