大数据技术之 Hive UDF

本文介绍了在Hive中如何自定义UDF和UDTF函数以满足特定业务需求。UDF是一进一出的函数,如计算字符串长度;UDTF则一进多出,如将字符串按分隔符切割。通过创建Maven工程,编写Java类,打包上传jar文件,并将其添加到Hive的classpath,可以创建并使用自定义函数。同时,文章还提及了GenericUDF和GenericUDTF的相关API。
摘要由CSDN通过智能技术生成

一、自定义函数

当 Hive 提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数。
UDF(User-Defined-Function)一进一出
UDAF(User-Defined Aggregation Function)聚集函数,多进一出,类似于:count/max/min
UDTF(User-Defined Table-Generating Functions)一进多出,如 lateral view explode()

1. 自定义 UDF 函数

0)需求:
自定义一个 UDF 实现计算给定字符串的长度,例如:

hive(default)> select my_len("abcd&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值