spark 写入hive报错[笔记]:Caused by: org.apache.spark.SparkException: Job aborted due to stage failure: Tas

小辉懂编程

已于 2023-12-15 10:50:32 修改

阅读量781

点赞数

分类专栏：报错问题文章标签： spark hive 笔记

于 2023-12-15 10:50:15 首次发布

本文链接：https://blog.csdn.net/m0_69097184/article/details/135011443

版权

报错问题专栏收录该内容

20 篇文章 0 订阅

订阅专栏

Spark将数据写入hive时报错：

Exception in thread "main" org.apache.spark.SparkException: Job aborted.

Caused by: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 2.0 failed 1 times, most recent failure: Lost task 0.0 in stage 2.0 (TID 2)

代码：

    val conf = new SparkConf().setMaster("local[*]").setAppName("four")
       
    val sc = new SparkSession.Builder()
      .config("hive.exec.dynamic.partition", "true")
      .config("hive.exec.dynamic.partition.mode", "nonstrict")
      .config(conf)
      .enableHiveSupport()
      .getOrCreate()

//写入hive表操作
   df.write
     .format("hive")
     .mode(SaveMode.Append)
     .saveAsTable("user.user_info")

报错分析：

由于写入时我认为是连接hive时不稳定导致的写入报错

问题解决

dfs.client.use.datanode.hostname=true

    val conf = new SparkConf().setMaster("local[*]").setAppName("four")
               .set("dfs.client.use.datanode.hostname", "true")
    val sc = new SparkSession.Builder()
      .config("hive.exec.dynamic.partition", "true")
      .config("hive.exec.dynamic.partition.mode", "nonstrict")
      .config(conf)
      .enableHiveSupport()
      .getOrCreate()

//写入hive表操作
   df.write
     .format("hive")
     .mode(SaveMode.Append)
     .saveAsTable("user.user_info")

HDFS客户端直接使用DataNode的主机名而不是IP地址来连接到DataNode。

默认情况下，HDFS客户端会使用DataNode的IP地址来建立连接。但是，在某些情况下，可能存在多个IP地址对应同一个主机名的情况，这时客户端可能会连接到错误的DataNode。通过设置dfs.client.use.datanode.hostname为true，客户端会使用主机名来建立连接，从而避免这个问题。

小辉懂编程

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
spark 写入hive报错[笔记]:Caused by: org.apache.spark.SparkException: Job aborted due to stage failure: Tas

Spark将数据写入hive时报错：Exception in thread "main" org.apache.spark.SparkException: Job aborted.Caused by: org.apache.spark.SparkException: Job aborted due to stage failure: Task 0 in stage 2.0 failed 1 times, most recent failure: Lost task 0.0 in stage 2.0 (TID
复制链接

扫一扫