Struct复杂数据类型的UDF编写、GenericUDF编写

最新推荐文章于 2024-09-01 09:18:08 发布

zhaowei121

最新推荐文章于 2024-09-01 09:18:08 发布

阅读量701

点赞数

原文链接：https://yq.aliyun.com/articles/740002?utm_content=g_1000095436

版权

一、背景介绍：

MaxCompute 2.0版本升级后，Java UDF支持的数据类型从原来的BIGINT、STRING、DOUBLE、BOOLEAN扩展了更多基本的数据类型，同时还扩展支持了ARRAY、MAP、STRUCT等复杂类型，以及Writable参数。Java UDF使用复杂数据类型的方法，STRUCT对应com.aliyun.odps.data.Struct。com.aliyun.odps.data.Struct从反射看不出Field Name和Field Type，所以需要用@Resolve注解来辅助。即如果需要在UDF中使用STRUCT，要求在UDF Class上也标注上@Resolve注解。但是当我们Struct类型中的field有很多字段的时候，这个时候需要我们去手动的添加@Resolve注解就不是那么的友好。针对这一个问题，我们可以使用Hive 中的GenericUDF去实现。MaxCompute 2.0支持Hive风格的UDF，部分Hive UDF、UDTF可以直接在MaxCompute上使用。

二、复杂数据类型UDF示例

示例定义了一个有三个复杂数据类型的UDF，其中第一个用ARRAY作为参数，第二个用MAP作为参数，第三个用STRUCT作为参数。由于第三个Overloads用了STRUCT作为参数或者返回值，因此要求必须对UDF Class添加@Resolve注解，指定STRUCT的具体类型。

1.代码编写

2.打jar包添加资源

3.创建函数

4.使用UDF函数

三、使用Hive的GenericUDF

这里我们使用Struct复杂数据类型作为示例，主要处理的逻辑是当我们结构体中两个字段前后没有差异时不返回，如果前后有差异将新的字段及其值组成新的结构体返回。示例中Struct的Field为3个。使用GenericUDF方式可以解决需要手动添加@Resolve注解。

1.创建一个MaxCompute表

2.表中数据结构如下

查询数据如下所示：

3.编写GenericUDF处理逻辑

（1）QSC_DEMOO类

（2）PubSimpleStruct类

3、打jar包，添加资源

4、创建函数

5、测试使用UDF函数

查询结果如下所示：

注意：
（1）在使用兼容的Hive UDF的时候，需要在SQL前加set odps.sql.hive.compatible=true;语句，set语句和SQL语句一起提交执行。

（2）目前支持兼容的Hive版本为2.1.0，对应Hadoop版本为2.7.2。如果UDF是在其他版本的Hive/Hadoop开发的，则可能需要使用此Hive/Hadoop版本重新编译。

本文作者：刘-建伟

本文为阿里云内容，未经允许不得转载。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

zhaowei121 CSDN认证博客专家 CSDN认证企业博客

码龄7年

42: 原创

3万+: 周排名

220万+: 总排名

47万+: 访问

: 等级

5267: 积分

64: 粉丝

66: 获赞

24: 评论

337: 收藏

私信

关注

最新评论

ChaosBlade 发布对 C++ 应用混沌实验的支持
断了的弦刀: 问题1:挂载客户端时指令中的port从哪获取问题2:步骤二里processName ，怎么获取，我用ps命令看到的是一大长串字符串，是否可以指定pid做到唯一标识进程
房讯通：房产估价背后的混合云服务
程序袁1207: 怎么收费
基于Flink和规则引擎的实时风控解决方案
aidedmniy: 基于Flink流处理的动态实时电商实时分析系统【完整版65讲，附源码+课件】下载地址：https://download.csdn.net/download/iolahkuy/63922449
Flink Checkpoint 问题排查实用指南
大石_001: 想请教下, 开启增量checkpoint下, 为什么webUI上看checkpoint的history的Checkpointed Data Size每次都是一样的几百兆, 看了下已经没有新数据进来了
Flink Checkpoint 问题排查实用指南
小小练习生: wei哥要徒弟不要 f我要在用flink 想跟着开阔flink见识

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。