spark-sql sql on yarn --deploy-mode cluster 改造

青冬

于 2023-09-18 16:35:13 发布

阅读量544

点赞数

分类专栏： hadoop 文章标签： spark sql 大数据

转载必须得到本人许可，未经允许，不得转载

本文链接：https://blog.csdn.net/qq_36610426/article/details/132984595

版权

hadoop 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

前言

众所周知，spark-sql 不能提交到远端并且使用 cluster进行部署：

huangyichun@bigdata130023:~ # spark-sql --master yarn --deploy-mode cluster
Exception in thread "main" org.apache.spark.SparkException: Cluster deploy mode is not applicable to Spark SQL shell.
     at org.apache.spark.deploy.SparkSubmit.error(SparkSubmit.scala:972)
     at org.apache.spark.deploy.SparkSubmit.prepareSubmitEnvironment(SparkSubmit.scala:283)
     at org.apache.spark.deploy.SparkSubmit.org$apache$spark$deploy$SparkSubmit$$runMain(SparkSubmit.scala:898)
     at org.apache.spark.deploy.SparkSubmit.doRunMain$1(SparkSubmit.scala:180)
     at org.apache.spark.deploy.SparkSubmit.submit(SparkSubmit.scala:203)
     at org.apache.spark.deploy.SparkSubmit.doSubmit(SparkSubmit.scala:90)
     at org.apache.spark.deploy.SparkSubmit$$anon$2.doSubmit(SparkSubmit.scala:1043)
     at org.apache.spark.deploy.SparkSubmit$.main(SparkSubmit.scala:1052)
     at org.apache.spark.deploy.SparkSubmit.main(SparkSubmit.scala)

如果环境可以请使用 --deploy-mode client，如果有特殊需要请见下

这是由于spark-sql 提供了一种本地交互模式，让client端在交互模式中提供sql进行执行。但spark-sql 也有 -e 和 -f 模式，提供用户一种 -e sqlString 和 -f sqlFile 的方式运行，这两种方式并不需要交互模式。
所以对此本博客修改了spark-sql源码，删除了交互模式的退出判断，让spark-sql可以直接运行在 cluster中。并与源生一样，可以使用-e sqlString 以及-f sqlFile进行提交。

改造jar包获取

包可以直接下载这里（不需要积分，请好评），或者github查看源码更改spark版本
提供的包为 spark 3.2.2 版本，scala 2.12版本；与hadoop版本无关。

github地址： https://github.com/ChunChunWeb/spark-sql-for-cluster

运行方式

可以通过 shell 命令直接提交：

spark-submit --class org.apache.spark.sql.hive.cluster.SparkSqlCliClusterDriver  \
--master yarn \
--deploy-mode cluster \
my-spark-sql-cluster.jar

青冬

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark-sql sql on yarn --deploy-mode cluster 改造

众所周知，spark-sql 不能提交到远端并且使用 cluster进行部署：Cluster deploy mode is not applicable to Spark SQL shell.如果环境可以请使用 --deploy-mode client，如果有特殊需要请见下这是由于spark-sql 提供了一种本地交互模式，让client端在交互模式中提供sql进行执行。但spark-sql也有-e和-f模式，提供用户一种和-f sqlFile的方式运行，这两种方
复制链接

扫一扫

专栏目录