hive中如何自定义编写UDF函数

最新推荐文章于 2024-03-20 17:45:01 发布

只愿长胖十斤

最新推荐文章于 2024-03-20 17:45:01 发布

阅读量1.9k

点赞数 1

分类专栏： hive，自定义函数，UDF，jar包文章标签： hive 自定义函数 UDF jar包

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39468795/article/details/78358013

版权

hive，自定义函数，UDF，jar包专栏收录该内容

1 篇文章 0 订阅

订阅专栏

有时候hive提供的内置函数无法满足我们的需求，这时候我们就可以自定义函数了，步骤如下：

1、编写UDF代码

2、打包成jar包然后上传到服务器

3、将jar包添加到hive中

4、创建临时函数与写好的class绑定

5、使用我们自定义的函数

6、销毁不需要的函数

1、编写UDF代码：

我们使用eclipse编写java代码，首先我们需要导包，将hive安装目录下lib目录下的所有jar包导入到我们的项目中

然后创建一个名为UDF的工程，然后创建myUDF的包，最后在myUDF包下创建ADDUDF.java类，在ADDUDF中编写如下代码：

import org.apache.hadoop.hive.ql.exec.UDF;
   public final class ADDUDFextends UDF {
       public Integer evaluate(Integer a, Integer b) {
                          if (null == a || null == b) {
                                          return null;
                      } return a + b;
       }
       public Double evaluate(Double a, Double b) {
                          if (a == null || b == null)
                                          return null;
                                          return a + b;
                      }
   }

改代码的作用是将传入的两个参数相加，返回他们的和

自定义的UDF类必须继承UDF类，同时必须重载evaluate方法

2、打包到我们的服务器上：

右键包名，选择export -- java -- jar file -- 选择路径然后点击finish

3、将jar包添加到hive中

在hive命令行执行以下指令：

add jar /home/user/addudf.jar;

4、创建临时函数将我们编写的类与之绑定:

在hive命令行执行以下指令：

CREATE TEMPORARY FUNCTION myfun AS 'myUDF.ADDUDF';

其中myfun是我们自定义的函数名称，myUDF.ADDUDF是我们编写的java代码的包名以及类名即包名.类名

5、使用我们的自定义函数：

select myfun(3,5) from mytable;

执行结果：8

6、销毁我们不需要的函数：

DROP TEMPORARY FUNCTION myfun;

当外面使用hive的时候，经常会遇到使用内置函数很难完成的查询任务，这个时候我们可以考虑编写自定义函数来完成我们的任务，当然，前提是会编写java代码~

只愿长胖十斤

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。