Spark学习笔记之（二）：Spark 提交任务流程与任务生成

最新推荐文章于 2021-10-18 12:47:28 发布

Andromeda

最新推荐文章于 2021-10-18 12:47:28 发布

阅读量897

点赞数

分类专栏： Spark

本文链接：https://blog.csdn.net/u010737756/article/details/118414408

版权

Spark 提交 job 流程1.Spark 提交 job 流程2.提交脚本中的参数解析2.1 -jar 什么意思3.Excutor 怎么获取 task1.Spark 提交 job 流程2.提交脚本中的参数解析2.1 -jar 什么意思3.Excutor 怎么获取 task

摘要由CSDN通过智能技术生成

Spark 提交 job 流程

1.提交脚本中的参数解析
2.Spark 提交 job 流程 (on yarn)
- 2.1 on yarn-client （spark的driver跑在任务提交的本机上）
- 2.2 on yarn-cluster(spark driver跑在yarn上)
3 Spark任务生成

由于提交流程相对很抽象，笔者决定先从提交脚本中的常用参数讲起，再讲解提交流程的过程。

1.提交脚本中的参数解析

笔者项目使用的Spark版本为Spark-2.0.2。下图是笔者项目中实际提交Spark Streaming任务时所使用的提交脚本。具体任务相关的信息抹去了，那么本文就从该脚本中的参数配置讲起。
在这里插入图片描述

spark-submit \
	--master yarn \              		运行的模式
    --deploy-mode cluster \
    --name spark-test \          		在yarn界面看到的名字，如果不设置，那就是下面--class的值
	--driver-memory 1g \         		driver的内存
	--executor-memory 1g \       		每一个executor的内存
	--executor-cores 1 \         		executor数量
    --jars xxx.jar, xxx.jar, xxx.jar    第三方jar，比如hbase，flume、apache的一些工具jar
	--conf                              设置spark内定的参数
	--files /conf.properties \       	发送到集群的配置文件，可以直接new fileInputstream("conf.properties")来获取
	--class WordCount    \              主类
	/WordCount-20210702-1.0.0.jar \    	自己工程的jar

1.1 常用参数含义

spark-submit --help查看解释

$ bin/spark-submit --help
Usage: spark-submit [options] <app jar | python file> [app arguments]
Usage: spark-submit --kill [submission ID] --master [spark://...]
Usage: spark-submit --status [submission ID] --master [spark://...]

Options:
  --master MASTER_URL         spark://host:port, mesos://host:port, yarn, or local.
  --deploy-mode DEPLOY_MODE   Whether to launch the driver program locally ("client") or
                              on one of the worker machines inside the cluster ("cluster")
                              (Default: client).
  -

最低0.47元/天解锁文章

Andromeda

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark学习笔记之（二）：Spark 提交任务流程与任务生成

Spark 提交 job 流程1.Spark 提交 job 流程2.提交脚本中的参数解析2.1 -jar 什么意思3.Excutor 怎么获取 task1.Spark 提交 job 流程2.提交脚本中的参数解析2.1 -jar 什么意思3.Excutor 怎么获取 task
复制链接

扫一扫

专栏目录