udf spark java_如何使用Java来调用 spark数据文件中的UDF?

spark>=2.3

可以直接调用scala样式的udf:

import static org.apache.spark.sql.functions.*;

import org.apache.spark.sql.expressions.UserDefinedFunction;

UserDefinedFunction mode = udf(

(Seq ss) -> ss.headOption(), DataTypes.StringType

);

df.select(mode.apply(col("vs"))).show();

spark<2.3

即使我们假定您的UDF是有用的,并且不能被简单的getitem调用替换,它的签名也不正确。使用Scala WrappedArray而不是纯Java array公开 array列,因此必须调整签名:

UDF1 mode = new UDF1, String>() {

public String call(final Seq types) throws Exception {

return types.headOption();

}

};

如果已注册UDF:

sqlContext.udf().register("mode", mode, DataTypes.StringType);

您只需使用calludf(1.5中引入的新函数)按名称调用它:

df.select(callUDF("mode", col("vs"))).show();

您也可以在selectexprs中使用它:

df.selectExpr("mode(vs)").show();

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值