Oozie提供了一个方便的方式来运行任何命令。这可能是Unix命令,Perl或Python脚本,甚至java程序都可以通过Unix shell调用。shell命令运行在任意的Hadoop集群节点上,并且运行在结点上的命令必须保证可在本地可用。
本地提交:
格式:java -cp 全类名(包名.类名) -jar jar包名字
实例如下:
java -cp test1.OzzieTest1 -jar test.jar
运行结果:
shell action 语法:
...
[JOB-TRACKER]
[NAME-NODE]
......
[SHELL SETTINGS FILE]
[PROPERTY-NAME]
[PROPERTY-VALUE]
...
[SHELL-COMMAND]
[ARG-VALUE]...[ARG-VALUE]
[VAR1=VALUE1]...[VARN=VALUEN]
[FILE-PATH]...[FILE-PATH]...
...
shell action的组成元素如下所示:
• job-tracker (required)
• name-node (required)
• prepare ---执行删除文件或者创建目录的操作
• job-xml ---指定一个存在的配置文件
• configuration ---将里面配置的参数传递给任务
• exec (required) ---要执行的shell命令
• argument ---元素指定要传递给shell脚本的参数
• env-var ---传递给shell命令的环境变量
• file
• archive
• capture-outpu ---可以捕获输出
若想调用java类有三个是必需的:1.workflow.xml(名字不可改) 2.job.properties(名字可改) 3.jar包
示例如下:
1.workflow.xml---放到hdfs目录中
${jobTracker}
${nameNode}
mapred.job.queue.name
${queueName}
java
-cp
test1.OzzieTest1
-jar
test.jar
Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]
2. job.properties ---放本地即可
nameNode=hdfs://hgdp-001:8020
jobTracker=hgdp-001:8032queueName=defaulthdfspath=user/root
examplesRoot=ocn-itv-oozie
oozie.use.system.libpath=True
oozie.libpath=${nameNode}/${hdfspath}/${examplesRoot}/lib/oozie.wf.application.path=${nameNode}/${hdfspath}/${examplesRoot}/wf/wf5/
3.oozie运行:
启动任务:oozie job -config job.properties -run -oozie http://xxxx(地址):11000/oozie
运行结果如下图所示: