【大数据开发 Spark】第四篇:搭建 Spark 完全分布式 Yarn 运行环境

1 版本说明

  • jdk1.8.0_311
  • hadoop-3.1.3
  • spark-3.0.0

2 搭建 Spark 完全分布式 Yarn 运行环境

2.1 搭建 Hadoop 环境

在之前的文章中已经详细介绍过:【Hadoop 3】图文详解:搭建Hadoop完全分布式运行模式

因为是 Yarn 运行模式,因此要先保证 Hadoop 集群的正常运行,首先要启动 Hadoop 环境,进程情况如下,之后我们要配置 Spark 的完全分布式 Yarn 运行环境,其集群规划如下,有三台客户机,Worker 和 Master 的部署方式如下图红字所示:

在这里插入图片描述

2.2 Spark 配置

1、解压 Spark 压缩包

tar -zxvf spark-xx.tgz -C /目的地址

在这里插入图片描述

2、来到 Spark 下的 conf 目录,给环境变量文件改名,并且添加新的配置

在这里插入图片描述
在这里插入图片描述

来到最下面,添加 Java 环境变量,添加 Yarn 配置的路径

在这里插入图片描述

2.3 配置 Spark 历史服务器

来到 Spark 下的 conf 目录

(1)给 spark 默认配置文件改名

在这里插入图片描述

(2)添加配置,两个文件添加的内容与图片顺序对应

1)添加 spark-default.conf 的配置,配置日志存储路径和历史服务器端口

在这里插入图片描述

在这里插入图片描述在这里插入图片描述

2)在 HDFS 中创建上面指定的 directory 目录(hadoop fs -mkdir /directory)

3)添加 spark-env.sh 的配置

在这里插入图片描述
在这里插入图片描述

2.4 编写 Spark 集群启动的脚本

在这之前要进行各节点的 SSH 授权认证

#!/bin/bash

if [ $# -lt 1 ]
then
    echo "No Args Input..."
    exit ;
fi

case $1 in
"start")
        echo " --------------- 【启动】 ---------------"
        echo " --------------- 启动 spark 集群 ---------------"
        ssh hadoop102 "/opt/module/spark-3.0.0/sbin/start-all.sh"
        echo " --------------- 启动 Spark 历史服务器---------------"
        ssh hadoop102 "/opt/module/spark-3.0.0/sbin/start-history-server.sh"
;;
"stop")
        echo " --------------- 【关闭】 ---------------"
        echo " --------------- 关闭 spark 集群 ---------------"
        ssh hadoop102 "/opt/module/spark-3.0.0/sbin/stop-all.sh"
        echo " --------------- 关闭 Spark 历史服务器---------------"
        ssh hadoop102 "/opt/module/spark-3.0.0/sbin/stop-history-server.sh"
;;
*)
    echo "Input Args Error..."
;;
esac

2.5 启动集群

事先已启动 Hadoop,这里执行 Spark 的群起脚本,启动成功

在这里插入图片描述

查看当前 Java 进程状态,集群配置成功!

在这里插入图片描述

2.6 实例测试

用 Spark 自带的 jar 包进行测试

在这里插入图片描述
在这里插入图片描述

在监控页面中查看

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

超周到的程序员

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值