Hive的UDF编程

最新推荐文章于 2022-06-05 16:28:39 发布

倾斜的阿拉丁

最新推荐文章于 2022-06-05 16:28:39 发布

阅读量490

点赞数

分类专栏： hive udf 文章标签： function udf hive jar 编程

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/w511913253/article/details/46627055

版权

hive 同时被 2 个专栏收录

3 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

需要交流请进群-- 494831900 --我和群中朋友会及时回答

1：在eclipse中编写hive的自定义的函数时必须到入hadoop-core-1.1.2.jar ，hive-exec-0.9.0.jar 2个jar包。jar包可根据自己版本添加。

2 ：写一个类继承 UDF类重写其中的 evaluate()方法

public class CountString extends UDF{
public int evaluate(String str){
try {
String [] spilts=str.split("");
if(spilts.length>0){
return spilts.length;
}else{
return 0;
}
} catch (Exception e) {
return 0;
}

}
}

3：导出jar包不需要包含前面的2个jar包，只需导出实现类CountString即可。

4：把文件放到当到目录中 /usr/local/testdata/countudf.jar.

5:执行 hive 进如hive脚本页面，添加临时function,执行命令 add jar /usr/local/testjar/countudf.jar 。出现如下提示即可：

Added /usr/local/testjar/countudf.jar to class path
Added resource: /usr/local/testjar/countudf.jar

6：执行此命令：create temporary function countstr as 'com.hive.CountString';出现ok即可完成

countstr-->是hive的函数名称

7：select countstr(key) from test_table;（这是测试）统计出key的字数

8:这种方式在会话结束后，函数自动销毁，因此每次打开新的会话，都需要重新add jar并且create temporary function

9. 进入会话前自动创建
使用hive -i参数在进入hive时自动初始化

创建一个文件 vi hive_init 内容如下：

add jar /usr/local/testjar/countudf.jar;
create temporary function countstr as 'com.hive.CountString';

在启动hive脚本时使用如下命令 hive -i (文件)hive_init.

倾斜的阿拉丁

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Hive的UDF编程

1：在eclipse中编写hive的自定义的函数时必须到入hadoop-core-1.1.2.jar ，hive-exec-0.9.0.jar 2个jar包。jar包可根据自己版本添加。2 ：写一个类继承 UDF类重写其中的 evaluate()方法 public class CountString extends UDF{public int evaluate(String
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。