Spark报java.util.NoSuchElementException: head of empty list错误的解决方法

推荐:博主历时三年倾注大量心血创作的《大数据平台架构与原型实现:数据中台建设实战》一书已由知名IT图书品牌电子工业出版社博文视点出版发行,真诚推荐给每一位读者!点击《重磅推荐:建大数据平台太难了!给我发个工程原型吧!》了解图书详情,扫码进入京东手机购书页面!

在这里插入图片描述

 

 

如果在Spark Structured Streaming上使用了Arbitrary Stateful Operations, 也就是使用了mapGroupsWithStateflatMapGroupsWithState方法,而其中GroupState[S]的S又偏偏是一个自定义的类型,那么你就会遇到这个错误!产生这个错误的原因是Spark找不到相应的Encoder,Encoder的作用是负责JVM类类型和Spark SQL内部表示之间的相互转换。通常大部分的基础类型都通过SparkSession的implicit import声明了,而自定义的类型需要特别指定对应的Encoder,而这也并不困难,通过kryo我们可以方便地创建出encoder来解决这个错误。例如:假定我们的自定义State叫MyState,我们可以这样做:

import sparkSession.implicits._
implicit val stateEncoder = org.apache.spark.sql.Encoders.kryo[MyState]
sparkSession
  .xxx
  .groupByKey(...)
  .mapGroupsWithState(GroupStateTimeout.NoTimeout()){
    case (key: String, events: Iterator[Event], state: GroupState[MyState]) => ...
  }
  .xxx

本文原文链接: http://blog.csdn.net/bluishglc/article/details/81208008 转载请注明出处。

bluishglc CSDN认证博客专家 CSDN博客专家
耿立超,架构师,CSDN博客专家,14年IT系统开发和架构经验,对大数据、企业级应用架构、SaaS、分布式存储和领域驱动设计有丰富的实践经验。对Hadoop/Spark 生态系统有深入和广泛的研究,参与过Hadoop商业发行版的开发,目前负责企业数据中台的架构设计和开发工作,热衷函数式编程,著有《大数据平台架构与原型实现:数据中台建设实战》https://item.jd.com/12677623.html 一书。
©️2020 CSDN 皮肤主题: 数字20 设计师: CSDN官方博客 返回首页
实付0元
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值