Spark2与Oozie整合

本文详细记录了将Spark2与Oozie整合的过程,包括项目背景、运行环境、整合步骤以及遇到的问题和解决方案。在整合过程中,重点介绍了如何配置Oozie以支持Spark2,并分享了在Hue4界面上创建和提交工作流的步骤。文章还提到了权限设置、Spark2目录创建、作业属性配置以及解决执行报错的方法。
摘要由CSDN通过智能技术生成

项目背景

公司部门成立初期,现在业务是由Shell脚本编写然后定时进行运行。由于现在公司一般都是搭建的CDH,内置有Oozie。且Oozie操作简单,功能强大,并且有很好的图形化界面所以还是想要搞一下。在搞的过程中出现了一堆问题,就是spark2与Oozie的整合现在不是很成熟,网上资料也很少,基本是淌着过去的。。。

运行环境

CDH:CDH-5.13.2-1.cdh5.13.2.
Java:1.8
scala:2.11.8
spark:2.2.0

整合步骤

由于公司spark与Oozie已经安装完了,我就不再介绍CDH的安装步骤,具体可以参考我之前的文章,但是那个版本有点旧。
1.首先进入以下目录,默认的有spark的目录,但是没有spark2的目录,这时oozie在运行时就会调用spark目录下面的jar包,这是我们要创建spark2的目录。

2.运行以下命令

  • hadoop fs -mkdir /user/oozie/share/lib/lib_20180403101432/spark
  • hadoop fs -put /opt/cloudera/parcels/SPARK2-2.1.0.cloudera1-1.cdh5.7.0.p0.120904/lib/spark2/jars /user/oozie/share/lib/lib_20180403101432/spark2
  • hadoop fs -cp /user/oozie/share/lib/lib_20180403101432/spark/oozie-sharelib-spark-4.1.0-cdh5.7.0.jar /user/oozie/share/lib/lib_20180403101432/spark2
  • hadoop fs -cp /user/oozie/share/lib/lib_20180403101432/spark/oozie-sharelib-spark.jar /user/oozie/share/lib/lib_20180403101432/spark2
    目录结构如下

这里写图片描述

2 Oozie配置界面实验步骤

1,在hue4的界面上 首先点击
这里写图片描述

保存创建好的文档
这里写图片描述

然后进入hue创建workflow的界面,注意这里选择你刚才创建文档的名称。然后点击Add然后点击齿轮进行配置 如下
这里写图片描述

这里写图片描述

最后保存,提交。

配置文件提交

目录结构如下

这里写图片描述

workfow.xml 内容如下

<?xml version="1.0" encoding="UTF-8"?>
<workflow-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
    xmlns="uri:oozie:workflow:0.4" xsi:schemaLocation="uri:oozie:workflow:0.4 uri:oozie:workflow:0.4"
    name="oozie_demo">  
    <start to="User_time" />
    <action name="User_time">
        <spark xmlns="uri:oozie:spark-action:0.1">
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node> 
                        <configuration>
                        <property>
                    
评论 9
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值