spark，以yarn-cluster模式提交作业，作业总是执行两次。

最新推荐文章于 2024-04-25 15:01:32 发布

妖果yaoyao

最新推荐文章于 2024-04-25 15:01:32 发布

阅读量988

点赞数 2

分类专栏： spark 文章标签： spark

本文链接：https://blog.csdn.net/weixin_39768191/article/details/98529328

版权

spark 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

原因在于System.exit(0)的不正常应用，导致在以yarn-cluster模式提交时。cluster模式不支持shell，所以当执行到System.exit(0)，程序开始报错，然后集群会按照yarn设定好的AM重启次数（在CDH的yarn配置板块中搜索application即可看到次数设置），重新运行，而且如果程序没有错的话，结果就没有错，这样就很难发现错误了。

object Application {
  //初始化sparkSession对象
  val conf = new SparkConf()
  val sparkSession = SparkSession.builder().config(conf).enableHiveSupport().getOrCreate()

  def main(args: Array[String]): Unit = {
    //设置spark日志级别
    sparkSession.sparkContext.setLogLevel("WARN")

    sparkSession.close()
    System.exit(0)
  }

}

优惠劵

妖果yaoyao

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
3
评论
spark，以yarn-cluster模式提交作业，作业总是执行两次。

原因在于System.exit(0)的不正常应用，导致在以yarn-cluster模式提交时。cluster模式不支持shell，所以当执行到System.exit(0)，程序开始报错，然后集群会按照yarn设定好的AM重启次数（在CDH的yarn配置板块中搜索application即可看到次数设置），重新运行，而且如果程序没有错的话，结果就没有错，这样就很难发现错误了。object App...
复制链接

扫一扫