Spark使用Java编写UDF函数

最新推荐文章于 2024-03-24 14:34:12 发布

一个数据小开发

最新推荐文章于 2024-03-24 14:34:12 发布

阅读量2k

点赞数 5

分类专栏： # Spark 大数据文章标签： spark udf

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aaron_ch/article/details/113346185

版权

大数据同时被 2 个专栏收录

27 篇文章 9 订阅

订阅专栏

16 篇文章 3 订阅

订阅专栏

如下图查看Spark源码一共有23中UDF函数

他们之间最大的区别就是传参数的个数问题的区别

UDF1函数源码如下：

public interface UDF1<T1, R> extends Serializable {
    R call(T1 var1) throws Exception;
}

UDF2函数源码如下：

public interface UDF2<T1, T2, R> extends Serializable {
    R call(T1 var1, T2 var2) throws Exception;
}

代码中实现如下：

sparkSession.udf().register("udfName", (UDF1<Long, Double>) (parameter) -> parameter*0.2, DataTypes.DoubleType);

其中register()该注册函数的参数解释如下：

第一个参数udfName就是你的udf的名字

第二个参数中的parameter 就是传入的如要处理的参数

第三个参数就是处理完的返回的数据类型

注：特别说明的UDF1<Long,Double> 中的Long表示传入的参数的数据类型，Double表示返回的参数的数据类型，这个必须与上面提到的注册函数的第三个参数保持一致。

其他的UDF2-UDF22等都是同理往下推，传入的参数的个数不断增加，始终就返回一个值。

一个数据小开发

关注

5
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
Spark使用Java编写UDF函数

如下图查看Spark源码一共有23中UDF函数他们之间最大的区别就是传参数的个数问题的区别UDF1函数源码如下：public interface UDF1<T1, R> extends Serializable { R call(T1 var1) throws Exception;}UDF2函数源码如下：public interface UDF2<T1, T2, R> extends Serializable { R call(T1 va
复制链接

扫一扫

专栏目录

一个数据小开发 CSDN认证博客专家 CSDN认证企业博客

码龄9年

54: 原创

30万+: 周排名

197万+: 总排名

18万+: 访问

: 等级

845: 积分

101: 粉丝

174: 获赞

87: 评论

504: 收藏

私信

关注

热门文章

分类专栏

Hudi 6篇
Flink 6篇
大数据 27篇
Docker 2篇
笔记
Maven 1篇
Hive 6篇
Spark 16篇
Java 9篇
Hbase 3篇
Impala 2篇
Kudu 3篇
MySQL 2篇
Shell 3篇
Linux 3篇
Oracle 3篇
Gitlab 3篇

最新评论

Spark SQL根据竖线进行字符串split函数取最后一个数组值
ckriser: select element_at(split('12|34','[|]'), -1)
Flink查询关联Hbase输出
一起随缘: 大佬您好，hbases可视化工具能给发一份吗，非常感谢 1028259318@qq.com
Flink查询关联Hbase输出
小破烂学后端: 帅哥hbases可视化工具看到啦麻烦您给一下 2986993729@qq.com
Flink CDC 读取MySQL的数据
boy_meng: mysql5.7版本不兼容，启动找不到performance_schema.events_statements_summary_by_digest_supplement表
Flink SQL Kafka写入Hudi详解
优乐美R: 你好，博主，想请教一下以下问题：现在flink sql -> kafka 到 hudi 数据的确有upsert的效果了，那delete呢？比如我删除一条数据，我推送kafka 的消息体里面设置了这个 map.put("_hoodie_is_deleted", true); 但是在hudi 表里面还是能把这个数据查询出来

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。