如何在HUE上通过oozie调用Hive SQL工作流

最新推荐文章于 2023-12-06 20:26:18 发布

create17

最新推荐文章于 2023-12-06 20:26:18 发布

阅读量2k

点赞数

分类专栏： HUE 文章标签： HUE

本文链接：https://blog.csdn.net/CREATE_17/article/details/87825086

版权

10 篇文章 0 订阅

订阅专栏

HUE版本：3.12.0

Hive版本：2.1.0

前言

通过浏览器访问ip:8888登陆HUE界面，首次登陆会提示你创建用户，这里使用账号/密码：hue/hue登陆。

执行Hive SQL脚本查询mytable表数据前10条，field以”\t”分割，并输出到HDFS指定路径。

create table if not exists mytable(sid int ,sname string)
row format delimited fields terminated by ' ' stored as textfile;

样例数据mytable.txt，将其放到HDFS路径的/tmp/目录下

1 张三
2 李四
3 王五
4 李六
5 不告你

将数据导入mytable中，执行以下命令：

load data inpath "/tmp/mytable.txt" into table mytable;

在HDFS路径/user/hue/learn_oozie/mazy_hive_1下，创建mazy_hive_1.sql，sql中的参数使用${hivevar:参数}展示，内容如下：

INSERT overwrite directory '${hivevar:outputpath}'
row format delimited fields terminated by "\t"
SELECT sid,sname FROM mytable LIMIT 10;

将HiveServer2移动到箭头处，添加sql脚本，添加参数：

outputpath=/user/hue/learn_oozie/mazy_hive_1/output

如下图所示：

点击“设置”，如下图所示：

默认配置oozie.use.system.libpath为true，这样会在工作区目录下默认新建lib包，如果需要jar包依赖的话，可以放在lib目录下。

工作区的目录HUE会默认生成，也可以自定义设置，lib文件会生成在该工作区内。

这里将工作区设为：/user/hue/learn_oozie/mazy_hive_1。

设置完毕后，执行该Workflow。

执行Workflow后，会生成一个job作业，job所属用户为登陆HUE Web的用户。等Workflow执行成功后，在HDFS路径上查看/user/hue/learn_oozie/mazy_hive_1/output/00000-0文件，如下图所示：

在HUE上通过Oozie调用Hive SQL任务流：

码字不易，如果您觉得文章写得不错，请扫码关注公众号支持作者~ 您的关注是我写作的最大动力?

关注

专栏目录