Spark2与Oozie整合

项目背景

公司部门成立初期,现在业务是由Shell脚本编写然后定时进行运行。由于现在公司一般都是搭建的CDH,内置有Oozie。且Oozie操作简单,功能强大,并且有很好的图形化界面所以还是想要搞一下。在搞的过程中出现了一堆问题,就是spark2与Oozie的整合现在不是很成熟,网上资料也很少,基本是淌着过去的。。。

运行环境

CDH:CDH-5.13.2-1.cdh5.13.2.
Java:1.8
scala:2.11.8
spark:2.2.0

整合步骤

由于公司spark与Oozie已经安装完了,我就不再介绍CDH的安装步骤,具体可以参考我之前的文章,但是那个版本有点旧。
1.首先进入以下目录,默认的有spark的目录,但是没有spark2的目录,这时oozie在运行时就会调用spark目录下面的jar包,这是我们要创建spark2的目录。

2.运行以下命令

  • hadoop fs -mkdir /user/oozie/share/lib/lib_20180403101432/spark
  • hadoop fs -put /opt/cloudera/parcels/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904/lib/spark2/jars /user/oozie/share/lib/lib_20180403101432/spark2
  • hadoop fs -cp /user/oozie/share/lib/lib_20180403101432/spark/oozie-sharelib-spark-4.1.0-cdh5.7.0.jar /user/oozie/share/lib/lib_20180403101432/spark2
  • hadoop fs -cp /user/oozie/share/lib/lib_20180403101432/spark/oozie-sharelib-spark.jar /user/oozie/share/lib/lib_20180403101432/spark2
    目录结构如下

这里写图片描述

2 Oozie配置界面实验步骤

1,在hue4的界面上 首先点击
这里写图片描述

保存创建好的文档
这里写图片描述

然后进入hue创建workflow的界面,注意这里选择你刚才创建文档的名称。然后点击Add然后点击齿轮进行配置 如下
这里写图片描述

这里写图片描述

最后保存,提交。

配置文件提交

目录结构如下

这里写图片描述

workfow.xml 内容如下

<?xml version="1.0" encoding="UTF-8"?>
<workflow-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns="uri:oozie:workflow:0.4" xsi:schemaLocation="uri:oozie:workflow:0.4 uri:oozie:workflow:0.4"
    name="oozie_demo"> 
  • 6
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 9
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值