提交应用的脚本和可选参数
可以选择local模式下运行来测试程序,但要是在集群上运行还需要通过spark-submit脚本来完成。官方文档上的示例是这样写的(其中表明哪些是必要参数):
./bin/spark-submit \
--class <main-class> \
--master <master-url> \
--deploy-mode <deploy-mode> \
--conf <key>=<value> \
... # other options
<application-jar> \
[application-arguments]
常用参数如下:
-
--master
参数来设置 SparkContext 要连接的集群,默认不写就是local[*]【可以不用在SparkContext中写死master信息】 -
--jars
来设置需要添加到 classpath 中的 JAR 包,有多个 JAR 包使用逗号分割符连接 -
--class
指定程序的类入口 -
--deploy-mode
指定部署模式,是在 worker 节点(cluster)上还是在本地作为一个外部的客户端(client)部署您的 driver(默认 : client)这里顺便提一下yarn-client和yarn-cluster区别