SPark学习笔记:01-SPark集群搭建之Standalone模式

概述

Spark集群有4种搭建的方式,分别是Standalone、Yarn、Mesos和Kubernetes的方式。其中Mesos以前在国外用的比较多,现在新的版本中已经被移除了。

集群规划

机器名称IP角色
k8s-node3192.168.0.52master
k8s-node5192.168.0.109slave
k8s-node6192.168.0.44slave

环境准备

  • 修改主机名及主机名和IP地址的映射
    修改/etc/hosts文件,添加如下内容
192.168.0.52 k8s-node3
192.168.0.44 k8s-node6
192.168.0.109 k8s-node5

安装配置步骤

1、下载安装包

到官网下载对应Hadoop版本的Spark安装包,由于我的hadoop 集群是Hadoop3.3.1版本的,所以我准备安装Spark3.2.1以上的版本,下载地址:https://dlcdn.apache.org/spark/spark-3.3.0/spark-3.3.0-bin-hadoop3.tgz

在K8s-node3服务器上执行操作:

wget https://dlcdn.apache.org/spark/spark-3.3.0/spark-3.3.0-bin-hadoop3.tgz

2、解压文件

[root@k8s-node3 software]# tar -xzvf spark-3.3.0-bin-hadoop3.tgz

3.配置Spark

spark-env.sh文件

export SPARK_MASTER_HOST=k8s-node3
export SPARK_MASTER_PORT=6000
export SPARK_MASTER_WEBUI_PORT=8088

说明:

  • SPARK_MASTER_HOST 是主节点的主机名
  • SPARK_MASTER_PORT 是spark主节点服务监听地址,运行spark任务时需要用到该端口
  • SPARK_MASTER_WEBUI_PORT 是主节点WEB管理工具的监听端口,默认是8080,因为和我主机上的服务有冲突,所以改为9099

workers 从节点地址列表

k8s-node5
k8s-node6

4.将文件分发到worker节点

[root@k8s-node3 software]# scp -r spark-3.3.0-bin-hadoop3 k8s-node5:$PWD/
[root@k8s-node3 software]# scp -r spark-3.3.0-bin-hadoop3 k8s-node6:$PWD/

启动集群

[root@k8s-node3 sbin]# cd /home/software/spark-3.3.0-bin-hadoop3/sbin
[root@k8s-node3 sbin]# ./start-all.sh 

Tips: 注意,因为Hadoop集群的启动方式也是start-all.sh,所以不要直接执行start-all.sh,要先进入到

在浏览器输入http://192.168.0.52:9099,就可以进入到Spark的Web管理界面
image

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值