hadoop之oozie配置

本文详细介绍了Hadoop中的Oozie工作流,它用于组合多个Map/Reduce作业形成逻辑工作单元。Oozie是基于Java的Web应用程序,使用数据库存储工作流定义和实例。工作流通过DAG组织,支持Map/Reduce、HDFS、Pig等动作。Oozie还提供协调系统,允许基于时间、数据可用性或事件触发工作流。文章还涵盖了Oozie的安装步骤和一个MR任务流程案例。
摘要由CSDN通过智能技术生成

说明

Hadoop中执行的任务有时候需要把多个Map/Reduce作业连接到一起,这样才能够达到目的。在Hadoop生态圈中,Oozie它让我们可以把多个Map/Reduce作业组合到一个逻辑工作单元中,从而完成更大型的任务。

原理

Oozie是一种Java Web应用程序,它运行在Java servlet容器——即Tomcat——中,并使用数据库来存储以下内容:

工作流定义

当前运行的工作流实例,包括实例的状态和变量

Oozie工作流是放置在控制依赖DAG(有向无环图 Direct Acyclic Graph)中的一组动作(例如,HadoopMap/Reduce作业、Pig作业等),其中指定了动作执行的顺序。我们会使用hPDL(一种XML流程定义语言)来描述这个图。

 

hPDL是一种很简洁的语言,只会使用少数流程控制和动作节点。控制节点会定义执行的流程,并包含工作流的起点和终点(startendfail节点)以及控制工作流执行路径的机制(decisionfork

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值