大数据协作框架之Oozie

一、Oozie的介绍


一个基于工作流引擎的开源框架,是由Cloudera公司贡献给Apache的,它能够提供对HadoopMapReduce和Pig Jobs的任务调度与协调。Oozie需要部署到Java Servlet容器中运行。Oozie工作流定义,同JBoss jBPM提供的jPDL一样,也提供了类似的流程定义语言hPDL,通过XML文件格式来实现流程的定义。对于工作流系统,一般都会有很多不同功能的节点,比如分支、并发、汇合等等。Oozie定义了控制流节点(Control Flow Nodes)和动作节点(Action Nodes),其中控制流节点定义了流程的开始和结束,以及控制流程的执行路径(Execution Path),如decision、fork、join等;而动作节点包括Hadoop map-reduce、Hadoop文件系统、Pig、SSH、HTTP、eMail和Oozie子流程。 

二、Oozie的架构




Oozie三大实现功能:1)Workflow:顺序执行流程节点;2)Coordinator:定时触发workflow;3)Bundle Job:绑定多个coordinator。


Workflow:
Coordinator:


Bundle:

Oozie Server组件:


三、总结


在实际的企业项目中,由于业务需求的增多,MapRedcue/Hive Job较多,需要定时调度执行,并且某些业务功能需要多个Job进行协作完成,此时工作流调度框架Oozie正好为我们很好的解决此问题。Oozie功能很强大,在实际项目中只需掌握最基本使用最多的就好,其中WorkFlow中MapRedcue Action和Shell Action最为常用,使用时注意workflow.xml文件编写,依赖包和文件。Oozie中调度功能很强大,不仅支持基于时间的调度,还是支持基于数据可用性的调度,目前企业使用最多的就是基于时间调度。

  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

象在舞

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值