Standalone模式的Spark集群的安装部署【详细教程】

菩萨也落难

于 2024-10-05 15:59:10 发布

阅读量410

点赞数 11

分类专栏： Spark 文章标签： spark 大数据分布式

本文链接：https://blog.csdn.net/qq_63834914/article/details/142714514

版权

1 篇文章 0 订阅

订阅专栏

Apache Spark作为当下最流行的大数据处理框架之一，凭借其高效的内存计算和丰富的API接口，广泛应用于实时数据处理、机器学习和图计算等领域。对于初学者和开发者而言，快速搭建一个Spark集群是进行学习和实验的重要步骤。

在众多部署模式中，独立模式（Standalone）是最为简单和直观的一种。它不需要依赖其他资源管理器（如Hadoop YARN或Mesos），只需几台机器即可轻松搭建一个完整的Spark集群。这种模式非常适合用于学习、测试和小规模生产环境。

本文将详细介绍如何在多台机器上搭建一个独立模式的Spark集群。我们将从环境准备开始，逐步讲解如何配置Spark，以及如何启动集群。希望通过这篇文章，能够帮助大家顺利搭建自己的Spark集群，为后续的大数据处理和分析工作打下坚实的基础。

下面这篇博客有详细讲解：

tar -zxvf spark软件包

vim ~/.bash_profile

#拷贝命令
cp spark-defaults.conf.template spark-defaults.conf

#编辑命令
vim ./spark-3.4.2-bin-hadoop3/conf/spark-defaults.conf

#拷贝命令
cp spark-env.sh.template spark-env.sh

#编辑命令
vim ./conf/spark-env.sh

#拷贝命令
cp workers.template workers

#编辑命令
vim ./conf/workers

#环境变量
scp -r ~/.bash_profile hd@node2/3:~/

#spark -- 路径根据自己的来
scp -r ./spark文件夹 hd@node2/3:~/software/

#启动命令
sbin/start-all.sh

#关闭命令
sbin/stop-all.sh

#查看进程
jps

到此，便完成了Standalone模式的Spark集群部署！

菩萨也落难

关注

专栏目录