Hive自定义函数

本文详细介绍了如何在Hive中通过自定义用户定义函数(UDF)来扩展功能,以计算字符串长度为例。步骤包括创建Maven工程、编写UDF类、打包jar并添加到classpath,以及在Hive中创建和使用自定义函数。
摘要由CSDN通过智能技术生成
自定义函数
1 Hive 自带了一些函数,比如: max/min 等,但是数量有限,自己可以通过自定义 UDF
方便的扩展。
2 Hive 提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义
函数( UDF user-defined function )。
3 根据用户自定义函数类别分为以下三种:
(1) UDF User-Defined-Function
一进一出
(2) UDAF User-Defined Aggregation Function
聚集函数,多进一出
类似于: count/max/min
(3) UDTF User-Defined Table-Generating Functions
一进多出
lateral view explode()
4 官方文档地址
https://cwiki.apache.org/confluence/display/Hive/HivePlugins
5 编程步骤:
(1)继承 Hive 提供的类
org.apache.hadoop.hive.ql.udf.generic.GenericUDF
org.apache.hadoop.hive.ql.udf.generic.GenericUDTF;
(2)实现类中的抽象方法
(3)在 hive 的命令行窗口创建函数
添加 jar
add jar linux_jar_path
创建 function
create [temporary] function [dbname.]function_name AS class_name;
(4)在 hive 的命令行窗口删除函数
drop [temporary] function [if exists] [dbname.]function_name;
自定义 UDF 函数
0 )需求 :
自定义一个 UDF 实现计算给定字符串的长度,例如:

 1)创建一个 Maven 工程 Hive

2 )导入依赖

 3)创建一个类

 

 

4 )打成 jar 包上传到服务器 /opt/module/data/myudf.jar
5 )将 jar 包添加到 hive classpath
hive (default)> add jar /opt/module/data/myudf.jar;
6 )创建临时函数与开发好的 java class 关联
hive (default)> create temporary function my_len as "com.atguigu.hive.
MyStringLength";
7 )即可在 hql 中使用自定义的函数
hive (default)> select ename,my_len(ename) ename_len from emp;
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大数据开发工程师-宋权

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值