Azkaban
weixin_42073629
这个作者很懒,什么都没留下…
展开
-
springboot集成调用Azkaban
一、 说明 1.Azkaban是由Linkedin公司推出的一个批量工作流任务调度器,主要用于在一个工作流内以一个特定的顺序运行一组工作和流程,它的配置是通过简单的key:value对的方式,通过配置中的dependencies 来设置依赖关系,这个依赖关系必须是无环的,否则会被视为无效的工作流。Azkaban使用job配置文件建立任务之间的依赖关系,并提供一个易于使用的web用户界面维护和跟踪你的工作流。 2.springboot版本:2.0.5 azkaban版本:3.59.0...原创 2020-09-29 21:23:00 · 1173 阅读 · 0 评论 -
Azkaban Flow 2.0的使用
一、Flow 2.0 简介1.1 Flow 2.0 的产生Azkaban 目前同时支持 Flow 1.0 和 Flow2.0 ,但是官方文档上更推荐使用 Flow 2.0,因为 Flow 1.0 会在将来的版本被移除。Flow 2.0 的主要设计思想是提供 1.0 所没有的流级定义。用户可以将属于给定流的所有job / properties文件合并到单个流定义文件中,其内容采用 YAML 语法进行定义,同时还支持在流中再定义流,称为为嵌入流或子流。1.2 基本结构项目 zip 将包含多个..原创 2020-08-12 00:48:54 · 766 阅读 · 0 评论 -
Azkaban Flow 1.0 的使用
一、简介Azkaban 主要通过界面上传配置文件来进行任务的调度。它有两个重要的概念:Job: 你需要执行的调度任务; Flow:一个获取多个 Job 及它们之间的依赖关系所组成的图表叫做 Flow。目前 Azkaban 3.x 同时支持 Flow 1.0 和 Flow 2.0,本文主要讲解 Flow 1.0 的使用,下一篇文章会讲解 Flow 2.0 的使用。二、基本任务调度2.1 新建项目在 Azkaban 主界面可以创建对应的项目:2.2 任务配置新建任务配置文件.原创 2020-08-11 23:59:11 · 276 阅读 · 0 评论 -
Azkaban 简介
一、Azkaban 介绍1.1 背景一个完整的大数据分析系统,必然由很多任务单元 (如数据收集、数据清洗、数据存储、数据分析等) 组成,所有的任务单元及其之间的依赖关系组成了复杂的工作流。复杂的工作流管理涉及到很多问题:如何定时调度某个任务? 如何在某个任务执行完成后再去执行另一个任务? 如何在任务失败时候发出预警? …面对这些问题,工作流调度系统应运而生。Azkaban 就是其中之一。1.2 功能Azkaban 产生于 LinkedIn,并经过多年生产环境的检验,它具备以下功能原创 2020-08-11 23:52:56 · 216 阅读 · 0 评论 -
Azkaban 3.x 编译及部署
一、Azkaban 源码编译1.1 下载并解压Azkaban 在 3.0 版本之后就不提供对应的安装包,需要自己下载源码进行编译。下载所需版本的源码,Azkaban 的源码托管在 GitHub 上,地址为 https://github.com/azkaban/azkaban 。可以使用git clone的方式获取源码,也可以使用wget直接下载对应 release 版本的tar.gz文件,这里我采用第二种方式:# 下载wget https://github.com/azkab...原创 2020-08-11 23:49:52 · 343 阅读 · 1 评论
分享