SparkBase中提交任务的参数以及main代码执行过程详解

关于Spark的提交参数官网链接

官网截图: 多看英文
在这里插入图片描述

  • 圆周率案例:
SPARK_HOME=/export/server/spark
${SPARK_HOME}/bin/spark-submit \
--master yarn  \
--deploy-mode client \
--driver-memory 512m \
--executor-memory 512m \
--num-executors 1 \
--total-executor-cores 2 \
--class org.apache.spark.examples.SparkPi \
${SPARK_HOME}/examples/jars/spark-examples_2.11-2.4.5.jar \
10
  • **基本参数配置:**提交运行Spark Application时,有些基本参数需要传递值,下图:

在这里插入图片描述
动态加载Spark Applicaiton运行时的参数,通过–conf进行指定
在这里插入图片描述

  • Driver Program 参数配置:
    每个Spark Application运行时都有一个Driver Program,属于一个JVM Process进程,可以设置内存Memory和CPU Core核数(资源)
    在这里插入图片描述
  • Executor 参数配置: (理解一下 数据量大的话通过它修改内存 CPU)
    在这里插入图片描述

总结:

Yarn:
--num-executors NUM     去启动的executors的数量,默认为2      
--executor-cores NUM 	每一个executor有多少cpu cores,yarn默认为1		
假如:num-executors=10个executors数量,每个executor有executor-cores=2,所有的executor的cpucores的数量10*2=20个
#Executor 的内存,真正执行计算的内存
--executor-memory MEM       Memory per executor (e.g. 1000M, 2G) (Default: 1G).         每个Executor的内存,1G	
假如:num-executors=10个executors数量,每个executor的内存--executor-memory=2G,所有参与计算的executors的内存是10*2=20G
	
--driver-cores NUM      Driver端使用的CPuCores集合,默认为1
#Driver 申请资源执行计算
--driver-memory MEM     Memory for driver (e.g. 1000M, 2G) (Default: 1024M).        Driver的内存,1G	
  • main代码执行流程:
    在这里插入图片描述
    除了SparkCOntext的开启和关闭其他的部分都在executor完成
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值