spark-submit 与 spark-shell 介绍

本文介绍了如何使用 spark-submit 启动 Spark 应用,详细讲解了 spark-submit 的参数配置,包括 Master URL、executor 内存和核心数等。此外,还深入探讨了 Spark Shell 的功能,如何启动 Spark Shell,以及在 shell 中编写和执行 wordcount 程序的步骤。
摘要由CSDN通过智能技术生成

一、spark-submit 介绍

1、spark-submit 介绍
程序一旦打包好,就可以使用 bin/spark-submit 脚本启动应用了。这个脚本负责设置 spark 使用的 classpath 和依赖,支持不同类型的集群管理器和发布模式。

2、运行方式

./bin/spark-submit \
  --class <main-class>
  --master <master-url> \
  --deploy-mode <deploy-mode> \
  --conf <key>=<value> \
  ... # other options
  <application-jar> \
  [application-arguments]

参数解析:
-- class: 你的应用的启动类 (如 org.apache.spark.examples.SparkPi)

-- master: 集群的 master URL (如 spark://23.195.26.187:7077)

-- deploy-mode: 是否发布你的驱动到 worker节点(cluster) 或者作为一个本地客户端 (client)

-- conf: 任意的 Spark 配置属性, 格式key=value。如果值包含空格,可以加引号“key=value”,缺省的 Spark 配置。

application-jar: 打包好的应用 jar,包含依赖。 这个 URL 在集群中全局可见。 比如 hdfs:// 共享存储系统,如果是 file:// path,那么所有的节点的path都包含同样的jar。

application-arguments: 传给 main() 方法的参数。

Master URL 可以是以下格式:
在这里插入图片描述

3、执行一个 spark 程序

/opt/module/spark-2.1
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值