spark环境安装及配置详细（附带相关错误及解决办法）

最新推荐文章于 2025-03-19 20:17:54 发布

笙念&

最新推荐文章于 2025-03-19 20:17:54 发布

阅读量1.8k

点赞数 1

分类专栏：大数据平台搭建文章标签： spark scala 大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lclchong/article/details/126076598

版权

大数据平台搭建专栏收录该内容

13 篇文章

订阅专栏

安装spark之前需要成功安装scala

解压安装包

更改名字

修改环境变量

使环境变量生效

修改配置文件

进入spark目录

进入conf

查看文件

更改文件名称

将spark-env.sh.template、slaves.template分别替换为spark-env.sh、slaves：

配置slaves

配置spark-env.sh

注意：8021端口，相当于hadoop3内部通信的8020端口，此处的端口需要确认自己的Hadoop配置

7、scala\spark拷贝到slave1、slave2节点：

8、启动spark：
需先启动hadoop：

Master; salve1

再启动spark

9.启动成功，查看任务进程

Master

Slave1

Slave2

浏览器访问：

错误排查方法

1 查看端口是否开启

运行命令 netstat–tunlp | grep 8080

查看8080端口是否开启。

2 查看占用端口的进程

运行命令lsof–i:8080

查看8080端口被那个进程占用。

3 查看运行日志

Spark主节点日志文件路径：

$SPARK_HOME/logs/*-Master-.log

$SPARK_HOME/logs/*-Master-.out

Spark从节点日志文件路径：

$SPARK_HOME/logs/*-Worker-.log

$SPARK_HOME/logs/*-Worker-.out

遇见错误：

spark都可以使用，三个节点分别有master、woker进程，测试spark程序也可以，就是打不开master:8080的网页。

解决办法：

可能是有的任务把8080端口占用

可以把默认的8080改为8081，如上图

二：

如果workers中无任务进行

可能是

url与设置的不一致，所以无法显示

解决方法：

更改设备中的url

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。