Hive的函数

Hive的函数

1UDF--标准函数

函数大全

2UDAF--聚合函数

个数统计--count 总和统计--sum 平均值统计--avg 最小值--min 最大值--max

直方图--histogram_numeric 集合去重函数--collect_set 集合不去重函数--collect_list

3UDTF--制表函数

explode---可以将数组和集合拆分成多行

自定义函数

1)自定义UDF

需要继承UDF类,实现它的evaluate函数(注意这里的类型和hadoop数据类型一样)

2)自定义UDAF

init()  -->所有阶段都要运行这个init方法

iterate()   -->map阶段的每条数据进行一次

terminatePartial()  --> mapcombiner结束返回结果,得到部分数据聚集结果

merge()  -->reduce阶段的合并。

terminate() -->最终的返回结果

3)自定义UDTF

1、继承GenericUDTF,主要写process(),closeinitialize()方法

4)自定义函数的使用

add jar /*/*.jar;

create [temporary] function **** as '主类名';

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值