Hive中用户自定义函数UDF、UDAF、UDTF的定义以及UDF具体实现

最新推荐文章于 2024-06-12 13:57:58 发布

YOU子先锋

最新推荐文章于 2024-06-12 13:57:58 发布

阅读量1.2k

点赞数 10

文章标签： hive 数据仓库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hfzchj/article/details/135762632

版权

前言

在Hive学习中，我们刚接触到用户自定义函数可能会有点不理解，下面我就根据我所知的来给跟我遇到过同样问题的人一点帮助。

目录

前言

简单定义

UDF具体实现预应用

运用

简单定义

UDF，源自于英文user-defined function。

我们根据函数输入输出的行数可以将其分为三类：UDF、UDAF、UDTF(不仅适用于用户自定义函数)

UDF:普通函数，特点是一进一出。例如取整函数round,接收一行数据，输出一行数据。

UDAF:聚合函数,A即Aggregation聚合的意思,特点是多进一出。可以简单理解为把一堆数据收集起来处理，输出一个统一结果。像count、sum、min、max以及数据收集函数collect_set()和collect_list等都属于聚合函数。

UDTF:表生成函数，T即Table-Generating表生成的意思,特点是一进多出。这种类型的函数作用返回的结果类似于表，同时UDTF也是我们接触比较少的函数。

UDF具体实现预应用

其实UDF的应用并不难，我大致分为以下几个步骤：

第一步：在IDEA中创建一个maven工程，写一个类继承UDF，并重载evaluate方法,方法中实现函数的业务逻辑。重载也意味着可以在一个java类中实现多个函数功能。

第二步：程序打成jar,上传到HDFS上(不会打包的可以看下面图)

第三步：客户端命令行中添加jar包到Hive的classpath,命令：

add jar /xxx/udf.jar;

（classpath 可以用于指定其他依赖项的位置，比如自定义的 UDF（用户自定义函数）或外部的 JAR 文件等。通过将这些依赖项添加到 classpath 中，Hive 可以在运行时访问它们。）

第四步:注册成为临时函数，命令：

create temporary function 函数名 as 'UDF类全路径';

（虽然第三步中将 UDF 的 JAR 包添加到 classpath中，但仅如此是无法直接使用 UDF 的，还需要将 UDF 注册到 Hive 中,将 UDF 声明为 Hive 可以识别和使用的函数。）

出现OK即代表成功注册，如果出现下面这种情况，则是全包路径出现错误或不一致导致。

运用

如果你上述都没有问题，那么就可以愉快的使用了你自己的udf了，下面是我的运用演示。

关注

10
点赞
踩
20

收藏

觉得还不错? 一键收藏
0
评论
Hive中用户自定义函数UDF、UDAF、UDTF的定义以及UDF具体实现

在Hive学习中，我们刚接触到用户自定义函数可能会有点不理解，下面我就根据我所知的来给跟我遇到过同样问题的人一点帮助。目录前言简单定义UDF具体实现预应用运用UDF，源自于英文user-defined function。我们根据函数输入输出的行数可以将其分为三类：(不仅适用于用户自定义函数)UDF普通函数，特点是一进一出。例如取整函数round,接收一行数据，输出一行数据。UDAF聚合函数,A即Aggregation聚合的意思,特点是多进一出。
复制链接

扫一扫

YOU子先锋 CSDN认证博客专家 CSDN认证企业博客

码龄2年

3: 原创

159万+: 周排名

21万+: 总排名

2200: 访问

: 等级

68: 积分

25: 粉丝

37: 获赞

1: 评论

38: 收藏

私信

关注

热门文章

最新评论

Hive中用户自定义函数UDF、UDAF、UDTF的定义以及UDF具体实现
CSDN-Ada助手: 非常棒的博客！你对Hive中用户自定义函数的解释非常清晰，让我对UDF、UDAF和UDTF有了更深入的理解。希望你可以继续写下去，分享更多关于Hive的知识。除了你在标题和摘要中提到的UDF、UDAF和UDTF，我想补充一些和Hive相关的扩展知识和技能。例如，你可以介绍一下Hive的分区和桶的概念，以及如何使用它们进行数据分析和优化查询性能。另外，你也可以探讨一下Hive的优化技巧，如使用索引和压缩技术来提高查询效率。希望我的建议对你有所帮助。期待看到你未来更多的博文！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
CentOS Linux 下编译安装redis,以及redis.conf配置文件
CSDN-Ada助手: 恭喜你成功写下了第一篇博客！标题看起来非常有趣，我很期待阅读你关于在CentOS Linux下编译安装redis的经验。对于初次博客创作来说，你已经很不错了！接下来，我建议你可以考虑分享一些关于如何优化redis.conf配置文件的技巧，以及可能遇到的一些常见问题和解决方法。这样的内容会对读者来说非常有帮助。祝你继续写作愉快！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。