oozie上传实例解读

最新推荐文章于 2021-04-19 09:12:46 发布

Zwenjun

最新推荐文章于 2021-04-19 09:12:46 发布

阅读量2.8k

点赞数

分类专栏： hadoop-oozie 文章标签： Hadoop oozie 实例

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Zwenjun/article/details/9033161

版权

hadoop-oozie 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

前些天oozie的安装已经全部完成了，下面我们来看看上传实例，oozie自带的有oozie的几个实例，这里我们以map-reduce为例讲解，初步了解下oozie的使用。

1.解压oozie-examples.tar文件：

tar-zxvf oozie-examples.tar

然后会解压出一个examples文件夹，在里面找到map-reduce文件夹。

2.看到该文件夹下有下面几个文件：

workflow.xml、job.properties和lib，下面我就具体说下这几个文件都是什么。

job.properties，这里提供了workflow.xml中所需要的参数，oozie在运行时，首先会调用job.properties来读取参数，具体内容如下:

nameNode=hdfs://localhost:8020

jobTracker=localhost:8021

queueName=default

examplesRoot=examples

oozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/apps/map-reduce

outputDir=map-reduce

这里的内容和我们实际搭建的环境不服，需要求改：

namenode改成hadoop的namenode地址，jobTracker同理。这里我们看到这样一个参数“oozie.wf.application.path”，这个参数是致命一个地址，这个地址就是oozie提交的实例需要存在于这个路径下。下面是我修改后的具体内容：

nameNode=hdfs://192.168.132.2:9000

jobTracker=192.168.132.2:9001

queueName=default

examplesRoot=examples

oozie.wf.application.path=${nameNode}/user/${user.name}/${examplesRoot}/apps/map-reduce

outputDir=map-reduce

workflow.xml这个文件说明了oozie工作流的流程规则，贴上具体代码：

<!--

Copyright (c) 2010 Yahoo! Inc. All rightsreserved.

Licensed under the Apache License, Version2.0 (the "License");

you may not use this file except incompliance with the License.

You may obtain a copy of the License at

http://www.apache.org/licenses/LICENSE-2.0

Unless required by applicable law or agreedto in writing, software

distributed under the License is distributedon an "AS IS" BASIS,

WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND,either express or implied.

See the License for the specific languagegoverning permissions and

limitations under the License. Seeaccompanying LICENSE file.

-->

<workflow-appxmlns="uri:oozie:workflow:0.1" name="map-reduce-wf">

<start to="mr-node"/>

<action name="mr-node">

<map-reduce>

<job-tracker>${jobTracker}</job-tracker>

<name-node>${nameNode}</name-node>

<prepare>

<deletepath="${nameNode}/user/${wf:user()}/${examplesRoot}/output-data/${outputDir}"/>

</prepare>

<configuration>

<property>

<name>mapred.job.queue.name</name>

<value>${queueName}</value>

</property>

<property>

<name>mapred.mapper.class</name>

<value>org.apache.oozie.example.SampleMapper</value>

</property>

<property>

<name>mapred.reducer.class</name>

<value>org.apache.oozie.example.SampleReducer</value>

</property>

<property>

<name>mapred.map.tasks</name>

<value>1</value>

</property>

<property>

<name>mapred.input.dir</name>

<value>/user/${wf:user()}/${examplesRoot}/input-data/text</value>

</property>

<property>

<name>mapred.output.dir</name>

<value>/user/${wf:user()}/${examplesRoot}/output-data/${outputDir}</value>

</property>

</configuration>

</map-reduce>

<ok to="end"/>

<error to="fail"/>

</action>

<kill name="fail">

<message>Map/Reduce failed, errormessage[${wf:errorMessage(wf:lastErrorNode())}]</message>

</kill>

<end name="end"/>

</workflow-app>

具体内容根据自己的需求来写，这个是实例，什么都不需要更改。

lib文件中保存的是需要的map-reduce的jar包。

下面我们就可以把这些文件上传到hadoop上：

$hadoopfs -mkdir /user/hadoop

$hadoopfs -put /usr/oozie/examples /user/hadoop/

这样我们的实例就全部上传上去了。然后我们可以执行下oozie：

ooziejob -oozie http://192.168.132.2:11000/oozie -config/usr/oozie/examples/apps/map-reduce/job.properties -run

之后我们会得到一个id，这个id就是job的id，然后登陆192.168.132.2:11000/oozie，就可以看到任务的执行状况。

截图：

任务进行中：

任务完成：

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
3
评论
oozie上传实例解读

前些天oozie的安装已经全部完成了，下面我们来看看上传实例，oozie自带的有oozie的几个实例，这里我们以map-reduce为例讲解，初步了解下oozie的使用。1.解压oozie-examples.tar文件：tar-zxvf oozie-examples.tar然后会解压出一个examples文件夹，在里面找到map-reduce文件夹。2.看到该文件夹下有下面几个文件
复制链接

扫一扫

专栏目录

Zwenjun CSDN认证博客专家 CSDN认证企业博客

码龄12年

19: 原创

44万+: 周排名

50万+: 总排名

4万+: 访问

: 等级

646: 积分

4: 粉丝

3: 获赞

5: 评论

12: 收藏

私信

关注

热门文章

分类专栏

PHP 1篇
Linux 4篇
杂七杂八 1篇
云计算Hadoop 1篇
Hadoop学习过程
hadoop-oozie 2篇
前端 1篇
C++基础 1篇
C# 3篇
设计模式 4篇
JavaWeb 1篇
Jenkins 1篇

最新评论

Apache Hadoop1.1.1+Apache Oozie3.3.2搭建安装过程详解（亲测）
顾北旧歌: 您好，我想问一下我加载数据库的时候报错了，DB schema exists，怎么解决啊，
Error: Cannot retrieve repository metadata (repomd.xml) for repository错误的解决
daydayupzzc: ths.this solved my problem!
oozie上传实例解读
shijiagod: 您好，我在运行examples的时候出现这样的情况：org.apache.hadoop.ipc.RPC$VersionMismatch: Protocol org.apache.hadoop.hdfs.protocol.ClientProtocol version mismatch. (client = 63, server = 61) ，查了很多网上的帖子，更改hadoop-core文件还是报一样的错误，求指导
oozie上传实例解读
Zwenjun 回复 bizcenter1: 你检查下你的数据库设置有没有问题，你的数据库用的是自定义的还是自带的Derby数据库？
oozie上传实例解读
bizcenter1: 您好：我的oozie在运行examples的时候总是出现：Error: E0803 : E0803: IO error, The transaction has been rolled back. See the nested exceptions for details on the errors that occurred. oozie.log的内容： Caused by: org.apache.openjpa.lib.jdbc.ReportingSQLException: Data truncation: Data too long for column 'proto_action_conf' at row 1 {prepstmnt 1994781650 INSERT INTO WF_JOBS (id, app_name, app_path, conf, group_name, parent_id, run, user_name, bean_type, auth_token, created_time, end_time, external_id, last_modified_time, log_token, proto_action_conf, sla_xml, start_time, status, wf_instance) VALUES (?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?) [params=?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?, ?]} [code=1406, state=22001]

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。