解决spark dataframe get 报空指针异常 java.lang.NullPointerException

56 篇文章 6 订阅

Spark 编程读取hive,hbase, 文本等外部数据生成dataframe后,一般我们都会map遍历get数据的每个字段,此时如果原始数据为null时,如果不进行判断直接转化为string,就会报空指针异常 java.lang.NullPointerException
示例代码如下:

val data = spark.sql(sql)

val rdd = data.rdd.map(record => {
  val recordSize = record.size
  for(i <- 0 to (recordSize-1)){
    val str = record.get(i).toString
    do something...
  }

为了解决该问题,可以对代码添加判空逻辑,如下所示:

val data = spark.sql(sql)

val rdd = data.rdd.map(record => {
  val recordSize = record.size
  for(i <- 0 to (recordSize-1)){
    val str = record.get(i)
    if(!record.isNullAt(i) && !str.toString.isEmpty){
     do something...
    }
  }

record.isNullAt(i) 判断第i个字段取值是否为null
不为null的话,再用isEmpty判断是否为空

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值