Hadoop环境Spark搭建

最新推荐文章于 2024-04-26 18:08:02 发布

码小白g

最新推荐文章于 2024-04-26 18:08:02 发布

阅读量1.4k

点赞数 1

文章标签： spark hadoop 大数据

本文链接：https://blog.csdn.net/qq_57656640/article/details/121774529

版权

该博客详细介绍了如何在Linux环境中下载、安装、配置并启动Spark集群。首先，将Spark二进制包下载到指定目录，然后解压并重命名。接着，修改配置文件如`spark-env.sh`和`slaves`，设置环境变量，并启动Spark Master和Worker。最后，通过`jps`检查进程，并在Web UI上验证集群状态。

摘要由CSDN通过智能技术生成

先将spark-2.1.1-bin-hadoop2.7.tgz下载到 /opt/software

然后解压到/opt/module

tar -zxvf spark-2.1.1-bin-hadoop2.7.tgz -C /opt/module

重命名文件夹方便以后使用

mv spark-2.1.1-bin-hadoop2.7.tgz spark

修改配置文件，先进入spark/conf文件夹

重命名配置文件

mv spark-env.sh.template spark-env.sh

修改/spark/sbin/start-master.sh文件

vi start.master.sh

if [ "$SPARK_MASTER_WEBUI_PORT" = "" ]; then
  SPARK_MASTER_WEBUI_PORT=8080
fi
改为
if [ "$SPARK_MASTER_WEBUI_PORT" = "" ]; then
  SPARK_MASTER_WEBUI_PORT=18080

修改spark-env.sh文件

vi spark.env.sh

export JAVA_HOME=/opt/module/jdk1.8.0_212
export SPARK_MASTER_HOST=hadoop001
export SPARK_MASTER_PORT=7077

配置slaves文件还是在spark /conf 文件夹

复制一份slaves.template文件后重命名

cp slaves.template slaves

修改slaves配置文件

vi slaves

hadoop002
hadoop003

修改全局变量

vi /etc/profile

#在最后一行添加

export SPARK_HOME=/opt/module/spark
export PATH=$PATH:$SPARK_HOME/bin
export PATH=$PATH:$SPARK_HOME/sbin

生效全局变量

source /etc/profile

查看是否可以启动

spark-shell

配置集群

将配置好的spark拷贝到他的副节点

scp -r /opt/module/spark/ @hadoop002: /opt/module/
scp -r /opt/module/spark/ @hadoop003: /opt/module/

spark集群要在他的sbin目录下启动

 ./start-all.sh

jps查看是否启动成功

网页查看集群

自己的ip地址:18080

码小白g

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫