Spark机器学习自定义sql函数处理Vector类型

最新推荐文章于 2023-11-24 00:03:34 发布

wzmfla

最新推荐文章于 2023-11-24 00:03:34 发布

阅读量1.1k

点赞数

分类专栏：机器学习文章标签： spark 机器学习 Vector sparksql udf

本文链接：https://blog.csdn.net/wzmfla/article/details/81186405

版权

机器学习专栏收录该内容

4 篇文章 0 订阅

订阅专栏

对于sparksql处理不了的类型，可以使用spark.udf.register自定义函数方法处理。

spark.udf.register("getPCA0", (s: Vector) => s(0))
spark.udf.register("getPCA1", (s: Vector) => s(1))
val sql = spark.sql("select getPCA0(pcaFeatures) as pca0,getPCA1(pcaFeatures) as pca1,prediction from predictions")
sql.show(10, false)

val model = PipelineModel.load(modelPath)
model.transform(df).createOrReplaceTempView("predictions")


spark.udf.register("getDga", (s: Vector) => s(1))
val sql = spark.sql("select domain_key as row_key,domain, getDga(probability) as probability from predictions where prediction == 1.0").cache()

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

wzmfla

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark机器学习自定义sql函数处理Vector类型

对于sparksql处理不了的类型，可以使用spark.udf.register自定义函数方法处理。spark.udf.register("getPCA0", (s: Vector) =&gt; s(0))spark.udf.register("getPCA1", (s: Vector) =&gt; s(1))val sql = spark.sql("select getPCA0(pca...
复制链接

扫一扫