spark sql 类型转换array,将两个Array [string]类型的spark sql列合并到新的Array [string]列中...

最新推荐文章于 2024-05-19 01:56:03 发布

忙哎

最新推荐文章于 2024-05-19 01:56:03 发布

阅读量1.6k

点赞数

文章标签： spark sql 类型转换array

I have two columns in a Spark SQL DataFrame with each entry in either column as an array of strings.val ngramDataFrame = Seq((Seq("curious", "bought", "20"), Seq("iwa", "was", "asj"))).toDF("filtered...

摘要由CSDN通过智能技术生成

I have two columns in a Spark SQL DataFrame with each entry in either column as an array of strings.

val ngramDataFrame = Seq(

(Seq("curious", "bought", "20"), Seq("iwa", "was", "asj"))

).toDF("filtered_words", "ngrams_array")

I want to merge the arrays in each row to make a single array in a new column. My code is as follows:

def concat_array(firstarray: Array[String],

secondarray: Array[String]) : Array[String] =

{ (firstarray ++ secondarray).toArray }

val concatUDF = udf(concat_array _)

val concatFrame = ngramDataFrame.withColumn("full_array", concatUDF($"filtered_words", $"ngrams_array"))

I can successfully use the concat_array function on two arrays. However when I run the above code, I get the followin

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

忙哎

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark sql 类型转换array,将两个Array [string]类型的spark sql列合并到新的Array [string]列中...

I have two columns in a Spark SQL DataFrame with each entry in either column as an array of strings.val ngramDataFrame = Seq((Seq("curious", "bought", "20"), Seq("iwa", "was", "asj"))).toDF("filtered...
复制链接

扫一扫