Spark打包运行（本地、yarn）两种模式

最新推荐文章于 2023-11-23 00:16:36 发布

Lino_white

最新推荐文章于 2023-11-23 00:16:36 发布

阅读量781

点赞数 2

分类专栏：竞赛知识点 Scala 笔记文章标签： spark

本文链接：https://blog.csdn.net/white_mvlog/article/details/115689386

版权

竞赛知识点同时被 3 个专栏收录

9 篇文章 6 订阅

订阅专栏

笔记

8 篇文章 0 订阅

订阅专栏

Scala

2 篇文章 0 订阅

订阅专栏

文章适合新手了解Spark打包的两种情况以及对应参数。文章在编写过程中难免有疏漏和错误，欢迎大佬指出文章的不足之处；更多内容请点进👉 Lino_White 👈查看。
未来的世界充满着各式各样的数据，我们该怎么好好利用起来呢？开启正文吧~~~

Spark打包运行（本地、yarn）

//本地
spark-submit --class com.white.sai2020.test1 
 --master local[*] ./test_spark.jar

spark-submit --class com.white.test1 --master yarn 
--driver-memory 4g --deploy-mode cluster
--executor-memory 2g --executor-cores 1 
--queue thequeue ./ a.jar 10

–deploy-mode（cluster、client）两种模式的区别

cluster模式： Driver程序在YARN中运行，应用的运行结果不能在客户端显示，所以最好运行那些将结果最终保存在外部存储介质（如HDFS、Redis、Mysql）而非stdout输出的应用程序，客户端的终端显示的仅是作为YARN的job的简单运行状况。

client模式： Driver运行在Client上，应用程序运行结果会在客户端显示，所有适合运行结果有输出的应用程序（如spark-shell）

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Lino_white

关注关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

大数据技术之Spark ——（一）Spark运行模式（local+standalone+yarn）

m0_46615073的博客

08-25

1062

文章目录前言一、Spark运行环境 1.1、spark运行环境概述 1.2、local模式 1.2.1、上传spark压缩文件并解压 1.2.2、启动local环境 1.2.3、命令行工具 (wordcount小测试) 1.2.4、提交应用 1.3、Standalone（独立部署模式） 1.3.1、解压缩文件 1.3.2、修改配置文件 1.3.3、启动集群 1.3.4、配置历史服务器 1.4、yarn模式 1.4.2、修改配置文件 1.4.3、启动HDFS和YARN 1

【spark】【在YARN上运行Spark】【Running Spark on YARN】

最新发布

wq6qeg88的博客

02-17

913

通常情况下，这并不重要，因为Spark在开始另一个阶段之前完成了一个阶段，唯一可能有影响的情况是在作业服务器类型的场景中，所以需要记住这一点。例如，当运行一个YARN集群，其中运行多个Spark版本的应用程序的混合工作负载时，这可能很有帮助，因为给定版本的shuffle服务并不总是与其他版本的Spark兼容。Spark发行版，由于它已经包含了内置的Hadoop运行时，默认情况下，当作业提交到Hadoop Yarn集群时，为了防止jar冲突，它不会将Yarn的classpath填充到Spark中。

参与评论您还未登录，请先登录后发表或查看评论

【大数据spark SQL项目实战】日志分析（九）：数据清洗作业运行到YARN上

06-12

358

1、打包修改代码： package com.kinglone.log import org.apache.spark.sql.{SaveMode, SparkSession} /** * 使用Spark完成我们的数据清洗操作：运行在YARN之上 */ object SparkStatCleanJobYARN { def main(args: Array[String]) { if(args.length !=2) { println("Usage: SparkStatC

Spark on yarn Intellij ide 安装，编译，打包，集群运行详解

ZHAOLEI5911的博客

03-28

1982

一intellij 安装centos65系统步骤一步骤二步骤三本地运行打包集群 yarn 运行说明：已经安装好hadoop2.2.0 完全分布，scala，spark已安装好，环境配置完毕；主机为hadoop-master，hadoop-slave一.intellij 安装（centos6.5系统）1.需要安装包ideaIc-2017.1.tar.gz（http://pan.baidu.co

Scala打包插件包含外部依赖

zhou_zhao_xu的博客

11-26

1056

<build> <plugins> <plugin> <groupId>net.alchim31.maven</groupId> <artifactId>scala-maven-plugin</artifactId&g...

pyspark运行模式(local,standalone,yarn)

Laozizuiku的博客

12-12

2192

运行模式 local模式：一般开发模式中使用常用参数 --master --name --py-files bin/spark-submit --master local[2] --name spark0402 /opt/datas/helloWord.py file:///opt/datas/spark_readme.txt file://...

Spark Standalone -- 独立集群模式、Spark 提交任务的两种模式、spark在yarn上运行的环境搭建、自己写的spark代码如何提交到yarn上并运行...

赤兔胭脂小吕布的博客

03-08

448

目录Spark Standalone -- 独立集群模式Standalone 架构图Standalone 的搭建1、上传、解压、重命名2、配置环境变量3、修改配置文件 conf4、同步到其他节点5、启动、关闭访问 spark web 界面Spark 提交任务的两种模式standalone client模式日志在本地输出，一般用于上线前测试(bin/下执行)standalone cluste...

【spark床头书系列】Spark YARN Cluster和Client两种不同提交模式区别：

wang2leee的博客

11-23

1029

YARN Cluster和Client两种不同提交模式详细区别

【spark床头书系列】如何在YARN上启动Spark官网权威详解说明

wang2leee的博客

10-10

400

在YARN上可以使用两种部署模式来启动Spark应用程序。在 `cluster` 模式下，Spark driver 在由YARN在集群上管理的应用程序主进程中运行，客户端在启动应用程序后可以退出。在 `client` 模式下，driver 在客户端进程中运行，应用程序主进程仅用于从YARN请求资源

大数据-计算引擎-Spark（二）：Spark安装与配置【Local模式、Standalone模式、Yarn模式】

u013250861的博客

01-30

675

大数据-计算引擎：Spark安装与配置【Local模式】

Spark on Yarn 的两种模式的区别

禧年

03-14

822

前言：面试官说有个小小的区别你知道么？面试问到你们这个spark是什么模式的? 答：Spark on yarn spark on yarn cluster 模式 ResourceManger 分配资源 ApplicationMaster (AM)通信 NodeManager NodeManger 开辟 Container，Container进行 executor执行job。同时资源情况以及...

在Yarn上运行spark-shell和spark-sql命令行

热门推荐

Ran

01-01

1万+

在Yarn上运行spark-shell和spark-sql命令行

Spark Yarn Client模式运行流程

The Zen of Data Analysis

03-26

470

以wordCount程序为例: 命令行内容： bin/spark-submit –class WordCount –master yarn –deploy-mode client ./WordCount.jar ./input ./output 运行流程命令行-脚本执行- SparkSubmit- 调用main(即Driver)-执行代码-初始化SC-任务切分-申请启动Executor...

spark错误集锦(一)——Exception in thread "main" java.lang.Exception: When running with master 'yarn' either

不负如来不负卿

06-06

4701

１、 Exception in thread "main" java.lang.Exception: When running with master 'yarn' either HADOOP_CONF_DIR or YARN_CONF_DIR must be set in the environment. at org.apache.spark.deploy.SparkSubm...

java提交spark任务到yarn平台

weixin_36647532的博客

06-21

1万+

一、背景采用spark的方式处理，所以需要将spark的功能集成到代码，采用yarn客户端的方式管理spark任务。不需要将cdh的一些配置文件放到resource路径下，只需要配置一些配置即可，非常方便二、任务管理架构三、接口 1、maven坐标  <dependency> &...

Spark利用（idea+maven+scala）创建wordcount打包jar并在spark on yarn上运行——Spark的开发

qq_43688472的博客

12-25

808

今天的你不付昨天的辛苦，今天的辛苦定会拥抱明日的幸福，每一次的成长，都要给自己以鼓励，每一次的突破，都给自己以信心，万花丛中我不是最美，但我有我的自信 ————————————送给一直努力的你今天的学习： Spark利用（idea+maven+scala）创建wordcount打包jar并在spark on yarn上运行——Spark的开发生产中就是这么玩的：一：我们先用 idea+m...

java spark yarn_Java代码使用Spark on Yarn 方式提交任务到带Kerberos认证的Hadoop集群

weixin_36022526的博客

02-16

851

项目中遇到Spark Yarn方式提交到Hadoop集群，访问集群HDFS时发现使用的当前用户，没有访问权限，经过排查后发现Hadoop集群是带Kerberos认证的集群，需要像hadoop一样使用Kerberos的认证用户登陆，然后查相关资料傻脸了，没有相关的内容，查了半天也只查到了在服务器上使用Spark-Submit命令提交时加入参数 --keytab /Kerberos/user.ke...

Spark源码解析之——YARN Cluster模式

平平无奇小码农~

11-08

1245

YARN Cluster模式执行脚本提交任务，实际是启动一个SparkSubmit的JVM进程； SparkSubmit类中的main方法反射调用YarnClusterApplication的main方法； YarnClusterApplication创建Yarn客户端，然后向Yarn发送执行指令：bin/java ApplicationMaster； Yarn框架收到指令后会在指定的NM中启动ApplicationMaster； ApplicationMaster启动Driver

java spark yarn_Spark on yarn

weixin_39563722的博客

02-24

227

概述spark on yarn是spark集群模式之一，通过resourcemanager进行调度，较之standalone模式，不需要单独启动spark服务。关于spark 的三种模式，上一篇文章(saprk zookeeper搭建spark高可用集群)中已经讲过，在此不做赘述。本文操作的前提是已经搭建好hdfs和yarn集群。环境主机名应用tvm13spark、Scalatvm14spark、...

spark on yarn 的两种处理模式的区别

07-11

Spark on YARN有两种处理模式，分别是Client模式和Cluster模式。 1. Client模式：在Client模式下，Spark应用程序的驱动程序运行在提交应用程序的客户端机器上。客户端向YARN ResourceManager提交应用程序，并且将...