-
Hive 自带了一些函数,比如:max/min等,当Hive提供的内置函数无法满足你的业务处
理需要时,此时就可以考虑使用用户自定义函数(UDF). -
根据用户自定义函数类别分为以下三种:
-
UDF(User-Defined-Function)
一进一出 -
UDAF(User-Defined Aggregation Function)
聚集函数,多进一出
类似于: count / max / min
hive> show functions;
hive> desc function upper;
hive> desc function extended upper;
#字符串连接函数: concat
select concat(‘abc’,‘def’,‘gh’);
#带分隔符字符串连接函数: concat_ws
select concat_ws(’,’,‘abc’,‘def’,‘gh’);
#cast类型转换
select cast(1.5 as int);
#get_json_object(json 解析函数,用来处理json,必须是json格式)
select get_json_object(’{“name”:“jack”,“age”:“20”}’,’$.name’);
#URL解析函数
select parse_url(‘http://facebook.com/path1/p.php?k1=v1&k2=v2#Ref1’,
‘HOST’);
#explode:把map集合中每个键值对或数组中的每个元素都单独生成一行的形式 -
UD
hive 自带函数
最新推荐文章于 2022-08-14 18:00:53 发布
这篇博客介绍了Hive自带的函数,如max/min,并强调了当内置函数不足以满足需求时如何使用用户自定义函数(UDF)。UDF分为三类:UDF(一进一出)、UDAF(多进一出,类似count/max/min)和UDTF(一进多出)。文章展示了concat、concat_ws、cast、get_json_object、parse_url等示例函数的用法,并提到了UDF开发的基本步骤和注意事项。
摘要由CSDN通过智能技术生成