大数据调度平台Azkaban初探

azkaban是大数据平台的一个开源的可视化调度平台,一般数仓会用来做任务调度。
使用大数据平台作为数仓的开发工具免不了涉及任务调度这一块,在以往的数仓开发建设过程中涉及到了两种调度方式,一种是直接调用大数据端的存储过程,另一种是调用sqoop抽数工具。

Sqoop抽数脚本调度

前提:准备好sqoop抽数脚本(.sh结尾文件),如:
脚本里面包含目标数据库及取数源库的数据库连接信息,一般连接信息会用另一个配置文件加密保存。
在这里插入图片描述
配置调度步骤:
1.在Azkaban平台下载最新的任务调度zip包;
2. 解压后将新的job程序放进去(.job结尾);
3. zip包里面一般会有start任务及finished任务,需要在finished任务里面加上新的job的名称到依赖里面去,确保在所有任务完成
后整个调度工作才结束;
4. 重新压缩zip包并上传Azkaban即可;

.job任务文件示例:
第一行是执行sqoop抽数文件的命令,第二行是该任务依赖的其他job
在这里插入图片描述

-----------------------------------------------------------------未完待续-----------------------------------------------------------

  • 2
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值