Hive用户自定义函数UDAF开发

最新推荐文章于 2024-04-26 17:46:45 发布

VIP文章乐活每天

最新推荐文章于 2024-04-26 17:46:45 发布

阅读量990

点赞数

分类专栏： hive 文章标签： hive UDAF

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014434044/article/details/96728414

版权

释义

UDAF是User Defined Aggregation Function的简称。UDAF用来进行聚合运算，其输入是多行数据，输出一个计算结果。

如何开发

UDAF有两种实现方式：继承UDAF；或继承AbstractGenericUDAFResolver。前一种方式是简单的方式，但其使用了java的反射机制，因此性能上比后一种方式要低效，因此生产上不建议使用第一种方式。

计算的逻辑设计

继承AbstractGenericUDAFResolver抽象类，需要实现一个getEvaluator方法，该方法返回一个实例，该实例继承GnericEvaluator抽象类，GnericEvaluator的实现类才是进行聚合计算的具体实现类。

GnericEvaluator有以下几个方法需要开发自己实现：getNewAggregationBuffer、iterate、merge、reset、terminatePartial、terminate。另外需要重写init方法，该方法在抽象类中已经实现，但其返回值是null，在开发时如果不重新该方法，可能会在调用时报控指针异常。

一般的UDAF函数在hive计算过程中涉及到三个阶段，对应方式：PARTIAL1、PARTIAL2、FINAL。

PARTIAL1阶段是map阶段计算，此阶段会调用函数的init、iterate、terminatePartial三个方法。

PARTIAL2阶段是map后的combine阶段，是部分结果聚合，此阶段会调用函数的init、merge、terminatePartial三个方法。

FINAL阶段是reduce阶段，输出给hive最终结果，此阶段会调用函数的init、merge、terminate三个方法。

一些特殊的UDAF只有Map阶段，对应方式：COMPLETE。

COMPLETE只有Map阶段，其调用方法init、iterate、terminate三个方法。

方法释义

getNewAggregationBuffer方法是返回一个AggregationBuffer实例，该实例实现了AggregationBuffer接口，该接口是个空的接口，其方法是根据实际需要自己定义。AggregationBuffer实例是用来缓存中间及最后聚合结果的。

reset方法是重置AggregationBuffer实例。

iterate方法是逐行处理输入的数据的。

merge是进行计算结果合并的，包括combine阶段及reduce阶段。

ter

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
2
评论
Hive用户自定义函数UDAF开发

释义UDAF是User Defined Aggregation Function的简称。UDAF用来进行聚合运算，其输入是多行数据，输出一个计算结果。如何开发UDAF有两种实现方式：继承UDAF；或继承AbstractGenericUDAFResolver。前一种方式是简单的方式，但其使用了java的反射机制，因此性能上比后一种方式要低效，因此生产上不建议使用第一种方式。计算的逻辑...
复制链接

扫一扫

专栏目录

乐活每天 CSDN认证博客专家 CSDN认证企业博客

码龄10年

42: 原创

11万+: 周排名

75万+: 总排名

5万+: 访问

: 等级

810: 积分

11: 粉丝

9: 获赞

12: 评论

35: 收藏

私信

关注

热门文章

分类专栏

java 5篇
scala 1篇
算法 1篇
hive 1篇

最新评论

Hive用户自定义函数UDAF开发
traveller5274: 是什么问题么？
Hive用户自定义函数UDAF开发
traveller5274: select myudaf(num,price) from (select 5 as num,10.1 as price union select 6 as num,11.1 as price)报错了
Java的finalize方法探究
CSDN-Ada助手: 推荐 Java 技能树：https://edu.csdn.net/skill/java?utm_source=AI_act_java
记一次NoClassDefFoundError错误
Oooops！: 您好怎么解决的？
记一次NoClassDefFoundError错误
Oooops！: 我替换了WEB-INF/lib下的elasticsearch-rest-client怎么还是不行呢求解

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。