日期函数
- select REPLACE(‘abcdefghabc’,‘abc’,‘xxx’)-把abc替换成xxx
- 时间戳转日期 from_unixtime(),unix_timestamp(‘2020-08-07’,‘yyyymmdd’)
20200820--->2020-08-20 转化
select from_unixtime(unix_timestamp('2020-08-07','yyyymmdd'),'yyyy-mm-dd'))
条件函数
if(score > 60,1,0)
coalese(col1,col2,col3)
字符函数
- 取字符串的一部分
substr('abcdf,2) bcdf
substr('abcdf,2,3) bcd
- 切割
split('a,b,c,d',',')[2] c
- 列转行
collect_set,把多行转一行
- json格式
get_joson_object(json,'$.key1.key2')
聚合函数
count(*)count(user_id) count(distinct column)
窗口函数/分析函数
row_number() rank() dense_rank(跳跃)
动态累计sum(sum(amount)) over(order by month)
表生成函数,行专列
- 使用lateralView() 、 expload()通常和udtf函数和json_tuple()等一起使用。输出多个对象
json_tuple
定义:当使用json_tuple对象时,可以显著提高效率,一次获取多个对象并且可以被组合使用
示例:
select json_tuple(’{“name”:“linda”,“server”:“www.baidu.com”}’,‘server’,‘name’)
输出结果:
linda www.baidu.com
ls/102931613
集合函数
- case when 转化