部署指南——部署模式

本文介绍了Spark的两种部署模式:Standalone和YARN。在Standalone模式下,详细阐述了如何安装集群、手动启动、资源调度以及与Hadoop的集成。而在YARN模式中,讨论了cluster和client模式的应用启动及添加额外Jars的方法。
摘要由CSDN通过智能技术生成

Spark Standalone Mode

Spark 提供了一个简单的 standalone 部署模式。您可以手动启动 master 和 worker 来启动 standalone 集群,或者使用我们提供的 launch scripts 脚本。可以为了测试而在单个机器上运行这些进程。

安装 Spark Standalone 集群

安装 Spark Standalone 集群,只需要将编译好的版本部署在集群中的每个节点上。

手动启动一个集群

可以启动一个 standalone master server 通过执行下面的代码:

./sbin/start-master.sh 

一旦启动,master 将会为自己打印出一个 spark://HOST:PORT URL,可以使用它来连接 workers,或者像传递 “master” 参数一样传递到 SparkContext 。。

类似地,可以启动一个或多个 workers 并且通过下面的代码连接到 master :

./sbin/start-slave.sh <master-spark-URL> 

启动一个 worker 之后,就可以通过 master 的 web UI ( 默认情况下是 http://localhost:8080)查看到了。

Resource Scheduling(资源调度)

可以通过 spark.cores.max 在 Spar

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值