Hive 自定义UDF

最新推荐文章于 2022-08-31 23:11:13 发布

树立flag

最新推荐文章于 2022-08-31 23:11:13 发布

阅读量223

点赞数

分类专栏： Hive hive自定义大小转换函数 Hive UDF 文章标签： UDF hive 自定义函数 UDF函数

本文链接：https://blog.csdn.net/qq_36567024/article/details/79239454

版权

Hive 同时被 3 个专栏收录

7 篇文章 0 订阅

订阅专栏

hive自定义大小转换函数

1 篇文章 0 订阅

订阅专栏

Hive UDF

1 篇文章 0 订阅

订阅专栏

本文介绍了如何在Hive中自定义UDF函数，包括创建Maven工程，定义并实现UDF类，配置依赖，编写evaluate方法，导出并上传jar包，最后在Hive客户端创建并使用自定义函数。

摘要由CSDN通过智能技术生成

Hive 自定义UDF函数

1.新建一个Maven工程

2.定义一个类，类名看心情，自己定 src/main/java 自己的包下建

3.在pom.xml中添加依赖

hive的maven依赖：放在<dependencies> </dependencies>标签中

<dependency>
<groupId>org.apache.hadoop</groupId>
<artifactId>hadoop-client</artifactId>
<version>2.7.3</version>
</dependency>
<dependency>
<groupId>org.apache.hive</groupId>
<artifactId>hive-exec</artifactId>
<version>1.2.1</version>
</dependency>
<dependency>
<groupId>org.apache.hive</groupId>
<artifactId>hive-jdbc</artifactId>
<version>1.2.1</version>
</dependency>

阿里的镜像资源下载：

<repositories>
<repository>
<id>nexus-aliyun</id>
<name>Nexus aliyun</name>
<url>http://maven.aliyun.com/nexus/content/groups/public</url>
</repository>
</repositories>

3.编写类：

继承UDF 类实现 evaluate

public Text evaluate(Text str){

if (str == null) {
return null;
}
if (StringUtils.isBlank(str.toString())) {
return null;
}

return new Text(str.toString().toLowerCase());
}

4.导出jar包

5.上传jar包到Linux（上传目录自己定例如 /opt/datas）

6.将jar包添加到hive add jar /opt/datas/lower_hive.jar;(add jar jar在linux上的目录)

7.hive客户端下创建函数：

1）永久函数:

CREATE FUNCTION [db_name.]function_name AS class_name

2）临时函数：hive > create temporary fuction 函数名 as ‘ 包名.类名’;

8.使用函数：select empno ,ename,my_lower(ename) lower_name from emp;(emp 是存在的表)

9.使用函数结果：

树立flag

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录