使用hue创建ozzie的pyspark action workflow

hue是一个Apache Hadoop ui系统,本篇文章介绍如何使用hue创建一个ozzie的pyspark action的workflow, 该workflow仅包含一个spark action。注意,本文使用的是python语言的pyspark。

  1. 编写一个python操作spark的程序。
    demo.py
from pyspark.sql import SparkSession

spark = SparkSession.builder.enableHiveSupport().appName(
"demo").getOrCreate()

# spark 的一些操作
.......

  1. 新建workflow
    在hue中创建workflow
    拖拽ozzie action

传入需要运行的python脚本

添加Python文件

  1. 对该action 进行一些属性的配置。
    spark 设置

对spark进行设置,可以选择spark的运行模式。
默认使用的是spark1 的库去执行,如果使用的是spark2,则需要设置属性oozie.action.sharelib.for.spark=spark2 如图所示。

在这里插入图片描述

进入2设置,进行一些变量的设置
oozie.libpath 需要使用到spark的一些jar包,填入路径jar包路径。

在这里插入图片描述
4. 该workflow已经设置成功,可以对其进行运行进行测试。

欢迎关注,互相学习,共同进步~

我的个人博客

我的微信公众号:编程黑洞

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值