Spark的submit命令

最新推荐文章于 2024-07-03 07:15:00 发布

Stevenson-Gavin

最新推荐文章于 2024-07-03 07:15:00 发布

阅读量980

点赞数

分类专栏： spark 集群 hadoop 文章标签： spark

本文链接：https://blog.csdn.net/columbia7311/article/details/75417541

版权

在Windows环境下，使用IntelliJ IDEA编译Spark 1.5.0的JavaWordCount示例，需导入相关jar包并打包成jar。提交命令包括在本地运行和集群运行，交互模式(-deploy-mode client)下可能遇到Java 8的错误，解决方案是切换到Java 7。

摘要由CSDN通过智能技术生成

在win系统下的Idea编译spark自带的JavaWordCount代码，到apache的官网下载对应的spark包spark-1.5.0-bin-hadoop2.6.tgz，从
spark-1.5.0-bin-hadoop2.6\examples\src\main\java\org\apache\spark\examples找到JavaWordCount源码在Idea上进行编译，编译的时候要导入spark-1.5.0-bin-hadoop2.6\lib下的jar包。当代码没有错误后在将其打成jar包。然后发送的集群上。
用submit命令进行提交。
命令参数如下：
一些常用选项：

--class:  #你的应用的启动类 (如 org.apache.spark.examples.SparkPi)
--master: #集群的master URL (如 spark://23.195.26.187:7077)
--deploy-mode: #是否发布你的驱动到worker节点(cluster) 或者作为一个本地客户端 (client) (默认就是 client模式)
--conf:  # 任意的Spark配置属性， 格式key=value. 如果值包含空格，可以加引号“key=value”.
--application-jar:  # 打包好的应用jar,包含依赖
--application-arguments:  # 传给main()方法的参数

具体的提交命令如下：

运行在本地：

spark-submit --master local --class org.apache.spark.examples.JavaWordCount --executor-memory 1G --total-executor-cores 2 ~/JavaWordCount.jar hdfs://Master:9000/user/hadoop/input/text