自定义UDF函数

大学生爱编程

已于 2022-07-06 15:24:45 修改

阅读量732

点赞数

文章标签： java spring 开发语言

于 2022-07-06 15:07:16 首次发布

本文链接：https://blog.csdn.net/qq_45409791/article/details/125639913

版权

一.自定义UDF函数以及加载到Linux上运行
1.引入依赖

        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-exec</artifactId>
            <version>1.2.1</version>
        </dependency>

注意：可能会出现引入依赖失败的情况，在settings文件中修改镜像
tab键与空格键的问题，此处用的是tab键开头，此点可能影响打包

<mirror>
	<id>alimaven</id>
	<name>aliyun maven</name> 
	<url>http://maven.aliyun.com/nexus/content/groups/public/</url>
	<mirrorOf>central</mirrorOf>
</mirror>
 <mirror>
	<id>aliyunmaven</id>
	<mirrorOf>*</mirrorOf>
	<name>spring-plugin</name>
	<url>https://maven.aliyun.com/repository/spring-plugin</url>
</mirror>

2.写代码，继承UDF，导包，实现逻辑，在文件夹中把jar包上传到Linux上

3.打jar包上传到Linux （后面跟jar包的完整路径）

add jar /usr/local/soft/jars/HiveUDF2-1.0.jar;

4.使用jar包资源注册一个临时函数
create temporary function 函数名 as ‘主类名’;

create temporary function fxxx1 as 'MyUDF';

5.使用所起的函数名处理数据

二.实现函数永久生效
（继上面3步骤进行）
把jar包放到HDFS上，不用手动add jar 直接使用函数

1.hdfs上创建一个文件夹存放jar包，将jar包上传至该目录

2.在hive shell中执行命令
三个参数分别为：永久函数名，主类名，jar包在hdfs上的路径

create function hxudf as 'com.shujia.hivefun.MyUDF' using jar 'hdfs:/shujia/bigdata17/jar/hive-udf1.jar';

3.退出hive，执行函数进行测试

大学生爱编程

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
自定义UDF函数

自定义UDF函数以及加载到Linux上运行1.引入依赖注意：可能会出现引入依赖失败的情况，在settings文件中修改镜像tab键与空格键的问题，此处用的是tab键开头，此点可能影响打包2.写代码，继承UDF，导包，实现逻辑3.打jar包上传到Linux （后面跟jar包的完整路径）add jar /usr/local/soft/jars/HiveUDF2-1.0.jar;4.使用jar包资源注册一个临时函数create temporary function 函数名 as ‘主类名’
复制链接

扫一扫