Azkaban实战-多job工作流案例

0.数据源:

word.txt:

AAA
BBB
DDD
CCC
AAA
Movle
Kai Movle
BBB yue 

word.txt

1.创建有依赖关系的多个job描述
(1)第一个job:1.job
vi 1.job

添加内容:

type=command
command=/opt/module/hadoop-2.8.4/bin/hadoop fs -put /opt/module/datas/word.txt /
(2)第二个job:2.job依赖1.job
vi 2.job

添加内容:

type=command
command=/opt/module/hadoop-2.8.4/bin/hadoop jar /opt/module/hadoop-2.8.4/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.4.jar wordcount /word.txt /out
dependencies=1

2.注意:将所有job资源文件打到一个zip包中
3.在azkaban的web管理界面创建工程并上传zip包

执行

4.查看结果

结果-查看对word.txt进行wordcount的结果
2.job的运行结果

思考:

将student.txt文件上传到hdfs,根据所传文件创建外部表,再将表中查询到的结果写入到本地文件

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值