大数据工作流Oozie

  • 提供Hadoop任务的调度和管理,不仅可以管理MapReduce任务,还可以管理pig、hive、sqoop、spark等任务,Oozie就是一个基于hadoop的工作流引擎。
  • 两个主要组件:

工作流定义组件:一系列Action个的列表(Action就是一个任务节点,eg:MapReduce任务、pig任务、hive任务等)

调度器组件:可调度的WorkFlow(workflow就是定义一个DAG的任务图,而调度器可以决定在某个时间或符合条件执行DAG(有向无环图 Direct Acyclic Graph)任务图)

  • Oozie工作流定义中的两种节点:

控制流节点:用于定义逻辑判断,eg:start、end、控制流程执行路径

动作节点:用户执行任务节点:hadoop任务、Oozie子流程

  • 定义一个完整Oozie工作流需编写3个文件

1、workflow.xml:(必需)定义工作流任务(需放到HDFS上)

2、config-default:(可选) 包括所有工作流共享的属性值

3、job.properties: (必需)针对每个工作流的属性值

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值