提交参数:
–deploy-mode: 允许决定是否在本地(使用client)启动Spark驱动成簇的参数,或者在集群内(使用cluster选项)的其中一台工作机器上启动。默人是client。
–name : 应用程序名称。注意,创建SparkSession时,如果是以编程方式指定应用程序名称,那么来自命令行的参数会被重写。
–exectuor-memory:参数指定每个执行器为应用程序分配多少内存。默认值是1G。
spark standalone两种提交模式,Standalone-client 和Standalone-master 模式
区别:
默认是client模式
eg:
spark-submit
–master spark://172.17.1.123:7077
–deploy-mode client
–executor-memory 5000
–total-executor-cores 12
–name mytest
tiku-practice-info.py
spark 配置的优先级
SparkConf > spark-submit 或 spark-shell >spark-defaults.conf