hive的自定义函数

为什么要自定义函数

  • hive自带了一些函数,比如max、min,但是数量有限,自己可以自定义UDF来方便的扩展
  • 当hive提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数(UDF:User-Defined-Function 较多)

根据用户自定义函数类别分为以下三种:

1.UDF:一进一出
2.UDAF:聚集函数 多进一出 类似于:count/max/min
3.UDTF:一进多出,如lateral view explore()
官方文档地址:
https://cwiki.apache.org/confluence/display/Hive/HivePlugins
编程步骤:
(1)继承org.apache.hadoop.hive.ql.UDF
(2)需要实现evaluate函数;evaluate函数支持重载
(3)在hive的命令行窗口创建函数
add jar linux_jar_path
创建function
create [temporary] function [dbname.]function_name AS class_name;
(4)在hive的命令行窗口删除函数
drop [temporary] function [if exists] [dbname.]function_name;
注意事项:
UDF必须要有返回值类型,可以返回null,但是返回类型不能为void。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值