1、字符串截取 substr()
用法:
substr(string string,num start,num length);
string为字符串;
start为起始位置;
length为长度,省略,则是从开始位置到最后。
不同sql的start的开始值不同,有的是0,有的是1,可以尝试一下
mysql从1开始,hive从0,1都可以
2.内容排名排序 row_number() over()
用例:SELECT *, row_number() over (partition by key1,key2 ORDER BY key2 desc) rank
FROM hive_jdbc_test where day='2018-1-1'
可用于数据库去除重复数据,保留一条,将where 条件改为 rank=1,就可以达到保留一条的效果。
3.字符串拼接concat()
用法:
concat(s1,s2,...)
返回连接参数产生的字符串,一个或多个待拼接的内容,任意一个为NULL则返回值为NULL。
4.字符串拼接concat_ws(x,s1,s2,s3...)
用法:
返回多个字符串拼接之后的字符串,每个字符串之间有一个x。
把分隔符x指定为null,结果全部变成了null
5.字符串分组拼接concat_group
功能:将group by产生的同一个分组中的值连接起来,返回一个字符串结果
语法:group_concat( [distinct] 要连接的字段 [order by 排序字段 asc/desc ] [separator '分隔符'] )
说明:通过使用distinct可以排除重复值;如果希望对结果中的值进行排序,可以使用order by子句;separator是一个字符串值,缺省为一个逗号。
6.hive 显示拉链分区
hive> show partitions table_name ;
7.case的使用
case when T.os = 'android' then 'android' when T.os = 'ios' then 'iPhone' else 'PC' end as os,
或者case T.os when 'android' then 'android' when 'ios' then 'iPhone' else 'PC' end as os,