函数分类
UDF
user-define-function:用户定义函数
进一条出一条
UDAF
user-define-aggregation-function:用户定义聚合函数
进多条出一条
如:max min avg sum count
UDTF
user-define-table-function:用户定义表函数
进一条出多条
如:explode函数
内置函数
在Hive2.3.2中内置的函数有271个
查看函数列表:show functions;
查看函数的使用方法:desc function funcname;
desc function max;
查看函数的详细使用方法:desc function extended funcname;
desc function extended max;
数值操作函数
聚合函数
max():取字段中的最大值
min():取字段中的最小值
avg():求字段的平均值
sum():求字段的所有值的和
count():统计字段中不为null的值的个数
注意:
聚合函数不能嵌套使用,如max(sum())
取整函数
ceil(x):参数为浮点数,返回大于等于参数的第一个整数
floor(x):参数为浮点数,返回小于等于参数的最大的整数
round(x[,d]):参数1为需要四舍五入的数据,参数2为保留的小数位数(默认为0)
取随机数
rand([seed]):参数为随机数种子,一般不设置参数
字符串操作函数
字符串切分
split(str, regex):参数1为需要切分的字符串,参数2为切分的分隔符,返回值为array
select split("1,2,3,4",",");
字符串的大小写转换
ucase(str)或者upper(str):转换所有小写字符为大写
lcase(str)或者lower(str):转换所有大写字符为小写
字符串截取
substr(需要截取的字符串,截取开始位置,截取的长度(默认到末尾))
注意:
hive中字符串的下标是从1开始的
字符串查询
inst

本文详细介绍了Hive中的分析函数,包括UDF、UDAF、UDTF,以及内置函数如max、min、avg、sum、count等。特别讨论了avg()函数用于计算平均值,并讲解了各种数值、字符串、日期操作函数的用法。还提到了自定义函数的创建和使用,以及窗口函数的应用,例如row_number()、rank()和dense_rank()等。
最低0.47元/天 解锁文章
2836

被折叠的 条评论
为什么被折叠?



