hive的内置函数大全

hive的常用内置函数

1.日期函数

返回值函数案例/备注
stringdate_add(开始日期,需要累加的天数select date_add(‘2020-01-08 12:13:15’,5) ==> 累加5天,返回2020-01-13
stringdate_sub(开始日期,需要减去天数)select date_sub(2020-01-08 12:13:14’,5)==>减去5天,返回2020-01-03
intdatediff(结束日期,起始日期)select datediff(‘2020-08-06 12:13:14’,’2020-06-05 08:09:10’) ==>相差1天,忽略时分秒
stringdate_format(date/timestamp/string,’yyyy’)select (current_timestamp,’MM-dd’)==>注意 这个函数只能是date/timestamp/string类型
intunix_timestamp()返回的是int类型,返回的是秒值,格式化这种数据使用的是from_unixtime(t,’yyyy-MM-dd’)
timestampcurrent_timestamp返回的是一个timestamp类型,返回的是带有毫秒值,格式化这种数据使用的是date_format(t,’MM-dd’)
bigintunix_timestamp(‘yyyy-MM-dd HH:mm:ss’)select unix_timestamp(‘2019-09-09 12:13:14’) ==>获取该时间的秒值
stringfrom_unixtime(unix_timestamp(),’yyyy-MM-dd HH:mm:ss’)select from_unixtime(unix_timestamp(),’yyyy-MM’)==>通过时间戳我只想要年和月
stringto_date(‘yyyy-MM-dd HH:mm:ss’)select to_date(‘2020-07-13 12:13:14’);==>返回的是字符串类型的时间,只有时间
intyear \month\ day \hour minute second weekofyear

2.类型转换函数

返回值函数案例/备注
typecast( 1 as string)select cast(1 as double); ===> 把1转换成double类型用于计算

3.条件函数

返回值函数案例/备注
Tif(条件,true,false)条件为真,执行true,否则执行false
Tnvl(comm,0)如果comm字段为null,执行0
Tcoalesce(comm,v1,v2,v3…)如果comm为null执行v1,如果v1为null执行v2以此类推
Tcase when deptno=10 then ‘a’ else ‘b’ end判断
Tcase deptno when 10 then ‘a’ else ‘b’ end判断
Booleanisnull(comm)如果comm为null,返回true
Booleanisnotnull(comm)如果comm不为null,返回true

4.标准函数

返回值函数案例/备注
stringconcat(‘a’,’b’…)select concat(‘a’,’b’,’c’) ==>abc
intinstr(‘ababab’,’ab’)select instr(‘ababcabab’,’abc’) ====>返回子字符串的位置 3
intlength(‘aaaaaa’)select length(‘aaaaaa’) ===>返回字符串的长度 6
intlocate(‘ab’,’ababababaab’,4)select locate(‘abc’,’ababcccabcddab,4);===>返回子字符串的位置,从第4个位置开始
stringlower(‘AAA’)select lower(‘AAA’)===>返回小写的字符串 aaa
stringupper(‘ssss’)select upper(‘aaa’) ====> 返回大写的字符串AAA
stringregexp_replace(‘aa 123 bb’,’[1-9]{3}’,’w’)select regexp_replace(‘aa 123 bb’,’[1-9]{3}’,’w’); 正则\s+ 代表的就是空白
arraysplit(‘aa bb cc’,’ ‘)select split(‘a b c’, ‘ ‘); ==>产生一个字符串数组
stringsubstr/substring(‘aback’,1,2)select substr(‘aback’,1,2); ==>截取子字符串,第一个字符代表1,从1开始,一共截取2个字符
stringtrim(‘ aa bb ‘)select trim(‘ aa bb cc ‘);===>只去掉前后空格
mapstr_to_map(’name-zs&age-18’,’&’,’-“)select str_to_map(’name-zs&age-18’,’&’,’-‘);====>最后产生一个map结构 {“name”:“zs”,“age”:"18”}
binaryencode(‘aaa’,’utf-8’)select encode(‘aaa’,’utf-8’) ===> 以utf-8进行对aaa字符串进行编码

5.自定义函数

# 5.1 集成UDF
  5.2 需要编写一个方法 ,方法名必须是 evaluate 
  5.3 打包上传到linux
  5.4 在hive中加载jar包 add jar /tmp/xxxxx.jar
  5.5 创建函数 create function fun as ‘包名.类名’
  5.6 使用
# 案例演示:
public class StringToLower extends UDF {
    public Text evaluate(Text str){
        if(str == null){
            return null;
        }
        return new Text(str.toString().toLowerCase());
    }
}

# 打成jar包、虚拟机下输入以下命令
add jar /tmp/zhibo2_6-1.0-SNAPSHOT.jar;

create function string2lower as 'cn.kgc.hive.StringToLower’; 创建了一个永久函数

0: jdbc:hive2://localhost:10000> select string2lower('aaaSSSddddeeeggggAAAAAAAAAAAA');
+--------------------------------+--+
|              _c0               |
+--------------------------------+--+
| aaasssddddeeeggggaaaaaaaaaaaa  |
+--------------------------------+————————————————+


当退出hive之后,再次进入,需要重新加载jar包

(1)如果本地加载jar包,退出再次进入,需要重新加载jar包,并且重新创建函数,然后才能使用.2)如果是hdfs的方式加载jar包,退出再次进入,不需要重新弄加载jar包,也不需要重新创建函数,直接使用即可.
add jar hdfs://hadoop1:9000/home/zhibo2_6-1.0-SNAPSHOT.jar;
删除函数:drop funcation str2lower;3)直接把jar包放在 hive目录下的 auxlib目录下即可。/opt/install/hive-1.1.0-cdh5.14.2/auxlib,不需要手动加载,每次启动hive自动加载这个目录下的jar包。


临时函数与永久函数的区别?临时函数只要hive的客户端不退出,在任何数据库中都可以使用;;;永久函数,在哪个数据库中创建的,只能在哪个数据库中使用.
    
    
统计单词的个数:wordcount案例。
select word, count(word) 
    from (select explode(split('aa bb cc dd aa aa bb bb ee',' ')) word)t1 
    group by word;
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值