hive 自带函数

最新推荐文章于 2022-08-14 18:00:53 发布

m0_48714980

最新推荐文章于 2022-08-14 18:00:53 发布

阅读量183

点赞数

本文链接：https://blog.csdn.net/m0_48714980/article/details/108730383

版权

这篇博客介绍了Hive自带的函数，如max/min，并强调了当内置函数不足以满足需求时如何使用用户自定义函数(UDF)。UDF分为三类：UDF（一进一出）、UDAF（多进一出，类似count/max/min）和UDTF（一进多出）。文章展示了concat、concat_ws、cast、get_json_object、parse_url等示例函数的用法，并提到了UDF开发的基本步骤和注意事项。

摘要由CSDN通过智能技术生成

Hive 自带了一些函数，比如：max/min等，当Hive提供的内置函数无法满足你的业务处
理需要时，此时就可以考虑使用用户自定义函数(UDF).
根据用户自定义函数类别分为以下三种：
UDF（User-Defined-Function）
一进一出
UDAF（User-Defined Aggregation Function）
聚集函数，多进一出
类似于： count / max / min
hive> show functions;
hive> desc function upper;
hive> desc function extended upper;
#字符串连接函数： concat
select concat(‘abc’,‘def’,‘gh’);
#带分隔符字符串连接函数： concat_ws
select concat_ws(’,’,‘abc’,‘def’,‘gh’);
#cast类型转换
select cast(1.5 as int);
#get_json_object(json 解析函数，用来处理json，必须是json格式)
select get_json_object(’{“name”:“jack”,“age”:“20”}’,’$.name’);
#URL解析函数
select parse_url(‘http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1’,
‘HOST’);
#explode：把map集合中每个键值对或数组中的每个元素都单独生成一行的形式
UD