一、自定义函数
当 Hive 提供的内置函数无法满足你的业务处理需要时,此时就可以考虑使用用户自定义函数。
UDF(User-Defined-Function)一进一出
UDAF(User-Defined Aggregation Function)聚集函数,多进一出,类似于:count/max/min
UDTF(User-Defined Table-Generating Functions)一进多出,如 lateral view explode()
1. 自定义 UDF 函数
0)需求:
自定义一个 UDF 实现计算给定字符串的长度,例如:
hive(default)> select my_len("abcd&#