(转载)Scala 报错:CSV data source does not support struct type:tinyint,size:int,indices:array int

56 篇文章 4 订阅
47 篇文章 3 订阅

运行Spark报错:Exception in thread “main” java.lang.UnsupportedOperationException: CSV data source does not support struct<type:tinyint,size:int,indices:array,values:array> data type. at

查看多篇博客发现:因为是DenseVector不可以直接报保存到csv文件

  • 可以有下面两种解决方法: (都是将数据列转化为String)
  1. 利用UDF函数
import org.apache.spark.sql.functions.udf

val stringify = udf((vs: Seq[String]) => s"""${vs.mkString(",")}""")
    df.withColumn("cloumnA", stringify($"cloumnA))
      .withColumn("cloumnB", stringify($"cloumnB"))
      .write.csv("xxxxx")
  1. 直接转化
case class Asso(antecedent: String, consequent: String, confidence: String)

df.rdd.map { line => Asso(line(0).toString, line(1).toString, line(2).toString) }.
      toDF().write.csv("xxxx")

参考:
https://jimolonely.github.io/2018/01/03/spark/02-write-csv/
https://cloud.tencent.com/developer/article/1531999

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值