HADOOP工作流调度系统OOZIE

  1. e.WordCount.Reduce</value>  
  2.                 </property>  
  3.                 <property>  
  4.                     <name>mapred.input.dir</name>  
  5.                     <value>${inputDir}</value>  
  6.                 </property>  
  7.                 <property>  
  8.                     <name>mapred.output.dir</name>  
  9.                     <value>${outputDir}</value>  
  10.                 </property>  
  11.             </configuration>  
  12.         </map-reduce>  
  13.         <ok to='end'/>  
  14.         <error to='end'/>  
  15.     </action>  
  16.     <kill name='kill'>  
  17.         <message>Something went wrong: ${wf:errorCode('wordcount')}</message>  
  18.     </kill/>  
  19.     <end name='end'/>  
  20. </workflow-app>
复制代码



配置打包后通过OozieClient提交给Hadoop就直接可以运行了
任务种类Oozie任务分为三种模式:

  • workflow – 这种方式最简单,就是定义DAG来执行。
  • coordinator – 它构建在workflow工作方式之上,提供定时运行和触发运行任务的功能。
  • bundle – bundle的作用就是将多个coordinator管理起来。这样我们只需要提供一个bundle提交即可。然后可以start/stop/suspend/resume任何coordinator。

Shell Action如果想通过Oozie调度远程服务器上的命令,可以通过ssh action来执行任意的shell命令。用户必须明确的上传所需要的第三方库。Oozie通过Hadoop的分布式缓冲来上传、打标签、使用。
Shell命令会在任意一个hadoop计算节点上运行,但是计算节点上默认安装的工具集可能会不一样。不过在所有的计算节点上,通常都装有大部分普通的unix工具。因此需要明确的很重要的一点是:Oozie只支持有被安装到计算节点上的命令或者通过分布式缓存上传的命令。也就是说,我们必须通过file上传我们要用到的文件。

http://www.aboutyun.com/forum.php?highlight=Oozie&mod=viewthread&tid=7288

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值