用户自定义函数
hive作为一个sql查询引擎,自带了一些基本的函数,比如count
(计数),sum
(求和),有时候这些基本函数满足不了我们的需求,这时候就要写hive hdf(user defined funation)
,又叫用户自定义函数。
关于Hive 的内置函数可以看Hive函数大全
UDF 创建与使用步骤
-
添加相关依赖,创建项目,这里我用的管理工具是maven,所以我创建的也是一个maven 项目(这个时候你需要选择合适的依赖版本,主要是Hadoop 和 Hive,可以使用
hadoop version
和hive --version
来分别查看版本) -
继承
org.apache.hadoop.hive.ql.exec.UDF
类,实现evaluate方法,然后打包 -
使用
add
方法添加jar 包到分布式缓存,如果jar包是上传到$HIVE_HOME/lib/目录以下,就不需要执行add命令了