Azkaban实战-多job工作流案例

最新推荐文章于 2023-05-12 08:54:02 发布

Movle

最新推荐文章于 2023-05-12 08:54:02 发布

阅读量450

点赞数

分类专栏： Azkaban

本文链接：https://blog.csdn.net/aflyingcat520/article/details/106169484

版权

Azkaban 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

0.数据源：

word.txt:

AAA
BBB
DDD
CCC
AAA
Movle
Kai Movle
BBB yue

word.txt

1.创建有依赖关系的多个job描述

(1)第一个job：1.job

vi 1.job

添加内容：

type=command
command=/opt/module/hadoop-2.8.4/bin/hadoop fs -put /opt/module/datas/word.txt /

(2)第二个job：2.job依赖1.job

vi 2.job

添加内容：

type=command
command=/opt/module/hadoop-2.8.4/bin/hadoop jar /opt/module/hadoop-2.8.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.4.jar wordcount /word.txt /out
dependencies=1

2.注意：将所有job资源文件打到一个zip包中

3.在azkaban的web管理界面创建工程并上传zip包

4.查看结果

结果-查看对word.txt进行wordcount的结果
2.job的运行结果

思考：

将student.txt文件上传到hdfs，根据所传文件创建外部表，再将表中查询到的结果写入到本地文件

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Movle

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Azkaban实战-多job工作流案例

0.数据源：word.txt:AAABBBDDDCCCAAAMovleKai MovleBBB yue 1.创建有依赖关系的多个job描述第一个job：1.jobvi 1.job添加内容：type=commandcommand=/opt/module/hadoop-2.8.4/bin/hadoop fs -put /opt/module/datas/word.txt /第二个job：2.job依赖1.jobvi 2.job添加内容：type=command
复制链接

扫一扫