Oozie与Spark2整合

准备Oozie环境

Oozie版本:4.2.0,从源码手动编译安装包

源码包:oozie-4.2.0.tar.gz

tar -zxvf oozie-4.2.0.tar.gz -C $OOZIE_SRC_HOME

Building Oozie

cd $OOZIE_SRC_HOME
bin/mkdistro.sh -DskipTests -Phadoop-2 -Dhadoop.auth.version=2.6.0 -Ddistcp.version=2.6.0 -Dspark.version=2.0.2

编译得到安装包:oozie-4.2.0/distro/target/oozie-4.2.0-distro.tar.gz

安装OOzie

tar -zxvf oozie-4.2.0-distro.tar.gz -C $OOZIE_HOME

安装libext

在$OOZIE_HOME下新建libext目录

1、拷贝ExtJS library到libext/

2、拷贝Hadoop的相关jar包到该目录下

cp $HADOOP_HOME/share/hadoop/*/*.jar libext/

cp $HADOOP_HOME/share/hadoop/*/lib/*.jar libext/

3、拷贝mysql驱动到该目录下(默认数据库是derby)

cp mysql-connector-java-5.1.25-bin.jar libext/

oozie相关的配置修改

Hadoop的core-xite.xml

<property>
    <name>hadoop.proxyuser.[USER].hosts</name>
    <value>*</value>
</property>
<property>
    <name>hadoop.proxyuser.[USER].groups</name>
    <value>*</value>
</property>

其中,[USER]需要改为后面启动oozie tomcat的用户
不重启hadoop集群,而使配置生效

hdfs dfsadmin -refreshSuperUserGroupsConfiguration
yarn rmadmin -refreshSuperUserGroupsConfiguration

配置数据库连接

<property>
    <name>oozie.service.JPAService.create.db.schema</name>
    <value>true</value>
</property>
<property>
    <name>oozie.service.JPAService.jdbc.driver</name>
    <value>com.mysql.jdbc.Driver</value>
</property>
<property>
    <name>oozie.service.JPAService.jdbc.url</name>
    <value>jdbc:mysql://node4:3306/oozie?createDatabaseIfNotExist=true</value>
</property>
 
<property>
    <name>oozie.service.JPAService.jdbc.username</name>
    <value>root</value>
</property>
 
<property>
    <name>oozie.service.JPAService.jdbc.password</name>
    <value>root</value>
</property>
<property>
    <name>oozie.service.HadoopAccessorService.hadoop.configurations</name>
    <value>*=/usr/hadoop/hadoop-2.6.0/etc/hadoop</value>
</property>

启动前初始化

a. 打war包  
bin/oozie-setup.sh prepare-war


b. 初始化数据库
bin/ooziedb.sh create -sqlfile oozie.sql -run

c. 修改oozie-4.2.0/oozie-server/conf/server.xml文件,注释掉下面的记录
<!--<Listener className="org.apache.catalina.mbeans.ServerLifecycleListener" />-->

d. 上传jar包
bin/oozie-setup.sh sharelib create -fs hdfs://node1:8020

启动

bin/oozie-start.sh

检查Oozie是否正常启动:http://node3:11000/oozie/

 

准备Spark2.×环境

Spark版本:2.0.2,预编译的安装包:spark-2.0.2-bin-hadoop2.7.tgz

Spark安装

 

Oozie Spark2支持

1、新建spark2的共享目录
hdfs dfs -mkdir /user/oozie/share/lib/lib_<ts>/spark2
2、上传spark2.*的依赖jar包到spark2的共享目录
hdfs dfs -put \
    /usr/spark/jars/* \
    /user/oozie/share/lib/lib_<ts>/spark2/
3、copy oozie-sharelib-spark的jar包到spark2共享目录
hdfs dfs -cp \
    /user/oozie/share/lib/lib_<ts>/spark/oozie-sharelib-spark-<version>.jar \
    /user/oozie/share/lib/lib_<ts>/spark2/

 

 

 

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值