注:以下是本人个人总结的,常用的一些hive的内嵌函数,可能有不足的,欢迎补充。
1.聚集函数
sum() --取字段数值的汇总
max() --取字段的最大值
min() --取字段的最小值
avg() --取字段数值的所有平均值
count() --统计字段的总个数
注:一般聚集函数会和分组函数(group by)一起使用,而且使用分组函数后,查询
的字段也只能出现分组字段和聚集函数。
2.字符串处理函数
substr(a,num1,num2) --字段截取函数,这个函数是取字段a,从num1位置开始取,取num2个字符。
concat(a,b) --字段拼接函数 ,将a,b拼接在一起成ab
concat_ws(’-’,a,b) --在字段a,b通过间隔符-拼接在一起成a-b
upper() --转大写
lower() --转小写
trim() --去除两边空格 (ltrim/rtrim 分别是去左边和右边空格)
lpad/rpad(a,num1,b)–左右填充函数,在a字段左/右填充num1个b
3.日期函数
unix_timestamp() --返回当前的时间戳
from_unixtime() --转换时间戳的格式
注:一般我们获取当前时间且是我们想要的格式