hive之函数

故明所以

于 2020-08-07 22:01:26 发布

阅读量240

点赞数 1

分类专栏：大数据hadoop生态组件文章标签：大数据 hive

本文链接：https://blog.csdn.net/weixin_43520450/article/details/107871191

版权

大数据hadoop生态组件专栏收录该内容

109 篇文章 16 订阅

订阅专栏

一、系统自带的函数

（1）查看系统自带的函数

hive> showfunctions;

（2）显示自带的函数的用法

hive> desc function upper;

（3）详细显示自带的函数的用法

hive> desc function extended upper;

二、自定义函数

（1）Hive 自带了一些函数，比如：max/min等，但是数量有限，自己可以通过自定义UDF来方便的扩展。

（2）当Hive提供的内置函数无法满足你的业务处理需要时，此时就可以考虑使用用户自定义函数（UDF：user-defined function）。

（3）根据用户自定义函数类别分为以下三种：

1）UDF（User-Defined-Function）

一进一出

2）UDAF（User-Defined Aggregation Function）

聚集函数，多进一出
类似于：count/max/min

3）UDTF（User-Defined Table-Generating Functions）

一进多出
比如lateral view explore()

（4）官方文档地址

链接:https://cwiki.apache.org/confluence/display/Hive/HivePlugins

（5）编程步骤：

1）继承org.apache.hadoop.hive.ql.UDF

2）需要实现evaluate函数；evaluate函数支持重载；

3）在hive的命令行窗口创建函数

添加jar

add jar linux_jar_path

创建function，

create [temporary] function [dbname.]function_name AS class_name;

4）在hive的命令行窗口删除函数

Drop [temporary] function [if exists] [dbname.]function_name;

（6）注意事项

UDF必须要有返回类型，可以返回null，但是返回类型不能为void。

三、自定义UDF函数开发案例

（1）创建一个java工程，并创建一个lib文件夹

（2）将hive的jar包解压后，将apache-hive-1.2.1-bin\lib文件下的jar包都拷贝到java工程中。

（3）创建一个 Lower类并继承UDF：

import org.apache.hadoop.hive.ql.exec.UDF;

public class Lower extends UDF {

       public String evaluate (final String s) {

              if (s == null) {
                     return null;
              }
              returns.toString().toLowerCase();
       }
}

（4）打成jar包上传到服务器/opt/module/jars/udf.jar

（5）将jar包添加到hive的classpath

hive (default)> add jar /opt/module/datas/udf.jar;

（6）创建临时函数与开发好的java class关联(全类名)

hive (default)> create temporary function udf_lower as
"com.itstar.hive.Lower";

（7）即可在hql中使用自定义的函数strip

hive (default)> select ename, udf_lower(ename) lowername from emp;

select ename `大写`, udf_lower(ename) `小写` from emp;

故明所以

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
hive之函数

目录一、系统自带的函数二、自定义函数三、自定义UDF函数开发案例一、系统自带的函数（1）查看系统自带的函数hive> showfunctions;（2）显示自带的函数的用法hive> desc function upper;（3）详细显示自带的函数的用法hive> desc function extended upper;二、自定义函数（1）Hive 自带了一些函数，比如：max/min等，但是数量有限，自己可以通过自定义UDF来方便的扩展。（2）当Hive提供的内置函
复制链接

扫一扫

专栏目录