hadoop-spark完全分布式集群搭建

周粥粥ya

已于 2022-05-30 10:11:40 修改

阅读量1.2k

点赞数 1

分类专栏：大数据文章标签：大数据 hadoop spark

于 2021-11-23 16:39:42 首次发布

本文链接：https://blog.csdn.net/NITIQ/article/details/121495666

版权

大数据专栏收录该内容

9 篇文章 3 订阅

订阅专栏

本文详细介绍了在 CentOS 7 系统中安装 Hadoop 2.7.7 和 Spark 2.1.1 的步骤，包括解压、配置环境变量、分发文件至节点、主节点设置及启动集群的过程。适合初学者理解分布式环境部署。

摘要由CSDN通过智能技术生成

本次采用的系统为centos7
hadoop版本为2.7.7
spark版本为2.1.1 链接：https://pan.baidu.com/s/1j4M21s6rURvl2uvZC_wxtQ
提取码：qwer
关于hadoop搭建请访问：Hadoop完全分布式集群搭建教程（一）

一、解压spark文件

我们同样把文件解压到根目录下的opt文件夹中

[root@localhost opt]# tar zxvf spark-2.1.1-bin-hadoop2.7.tgz 
#修改一下名称
[root@localhost opt]# mv spark-2.1.1-bin-hadoop2.7 spark-2.1.1

在这里插入图片描述

二、修改spark-env.sh文件

进入conf文件夹下，拷贝spark-env.sh.template

#进入路径
cd /opt/spark-2.1.1/conf
#拷贝文件
cp spark-env.sh.template spark-env.sh

在这里插入图片描述

#修改文件
vi spark-env.sh

加入以下内容
#配置java
#路径自己修改
export HADOOP_HOME=/opt/hadoop-2.7.7
#指定master的IP
#主机名自己修改
export SPARK_MASTER_HOST=master
#指定master的端口
export SPARK_MASTER_PORT=7077

在这里插入图片描述 # 三、修改slaves文件

#拷贝文件
cp slaves.template slaves
#修改文件
vi slaves

在这里插入图片描述
加入节点名称

四、分发给各节点

#分发给slave1
scp -r /opt/spark-2.1.1 slave1:/opt/
#分发给slave2
scp -r /opt/spark-2.1.1 slave2:/opt/

路径需要按照自己的来

五、主节点配置环境

进入profile文件，添加以下代码
vi /etc/profile
修改后
source /etc/profile

export SPARK_HOME=/opt/spark-2.1.1
export PATH=$PATH:$SPARK_HOME/bin:$HADOOP_HOME/sbin

六、启动

退回到根目录下

[root@localhost spark-2.1.1]# sbin/start-all.sh

查看jps
主节点：
在这里插入图片描述
从节点

周粥粥ya

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
打赏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录