Spark单机版集群及相应组件的搭建

魚y

已于 2024-04-28 14:39:07 修改

阅读量328

点赞数 3

文章标签：服务器运维分布式 spark 大数据 hadoop

于 2024-04-23 20:11:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_74749094/article/details/138135354

版权

解压Spark安装包

tar -zxf /opt/spark-3.2.1-bin-hadoop2.7.tgz -C /usr/local/

进入Spark安装目录的/bin目录，使用SparkPi计算Pi的值

cd /usr/local/spark-3.2.1-bin-hadoop2.7/bin/

./run-example SparkPi 2

如果执行时输出非常多的运行日志信息，输出结果找不到，就使用grep命令进行过滤（命令中的 2>&1 可以将所有的信息都输出到 stdout 中，否则由于输出日志的性质，还是会输出到屏幕中）

./bin/run-example SparkPi 2>&1 | grep "Pi is"

搭建单机伪分布式集群

将Spark安装包解压至Linux的/usr/local目录下

进入解压后的Spark安装目录的/conf目录下，复制spark-env.sh.template文件并重命名为spark-env.sh

cd /usr/local/spark-3.2.1-bin-hadoop2.7/conf/

cp spark-env.sh.template spark-env.sh

准备好java环境

设置 JAVA 环境变量

进入vi /etc/profile文件

source一下使生效，检查是否可用

打开spark-env.sh文件，在文件末尾添加代码：

export JAVA_HOME=/usr/local/src/jdk1.8.0_152
export HADOOP_HOME=/opt/software/hadoop
export HADOOP_CONF_DIR=/opt/software/hadoop/etc/hadoop
export SPARK_MASTER_IP=master
export SPARK_LOCAL_IP=master

启动Spark集群

cd /usr/local/spark-3.2.1-bin-hadoop2.7/sbin/

./start-all.sh

通过命令“jps”查看进程，如果既有Master进程又有Worker进程，那么说明Spark集群启动成功

输入IP进入网页浏览

192.168.128.134:50070

192.168.128.134:8080

切换至Spark安装包的/bin目录下，使用"SparkPi"计算Pi的值，运行结果如下：

启动spark-shell

cd /usr/local/spark-3.2.1-bin-hadoop2.7/

./bin/spark-shell

Scala组件的配置

首先从Scala官网下载Scala安装包，安装包名称为"scala-2.11.8.tgz",将其上传至/opt目录。解压安装包至/usr/local目录下，代码如下：

tar -zxf scala-2.11.8.tgz -C /usr/local/

为了方便使用Scala编程，使用命令"vim /etc/profile"打开配置文件/etc/profile，配置Scala变量，在文件末尾添加如下代码。保存并退出后，使用命令"source /etc/profile" 重新加载/etc/profile配置文件。

vim /etc/profile

export SCALA_HOME=/usr/local/scala-2.11.8

export PATH=$PATH:SCALA_HOME/bin

source /etc/profile

Scala的验证

scala

关注

3
点赞
踩
8

收藏

觉得还不错? 一键收藏
3
评论
Spark单机版集群及相应组件的搭建

进入解压后的Spark安装目录的/conf目录下，复制spark-env.sh.template文件并重命名为spark-env.sh。通过命令“jps”查看进程，如果既有Master进程又有Worker进程，那么说明Spark集群启动成功。进入Spark安装目录的/bin目录，使用SparkPi计算Pi的值。将Spark安装包解压至Linux的/usr/local目录下。进入vi /etc/profile文件。source一下使生效，检查是否可用。启动spark-shell。设置 JAVA 环境变量。
复制链接

扫一扫

魚y CSDN认证博客专家 CSDN认证企业博客

码龄2年

5: 原创

23万+: 周排名

11万+: 总排名

3736: 访问

: 等级

121: 积分

82: 粉丝

65: 获赞

7: 评论

68: 收藏

私信

关注

热门文章

最新评论

(续)Hadoop相应组件的搭建
2401_84182936: 优质好文，博主的文章细节很到位，兼顾实用性和可操作性，感谢博主的分享，文章思路清晰【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Hadoop完全分布式及相应组件的搭建
2401_84183545: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Spark单机版集群及相应组件的搭建
2401_84164721: 阅读这篇博文真是一次愉快的体验！作者的文字真是动人心弦，语言精准而生动。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
(续)Hadoop相应组件的搭建
2401_84181108: 写的很好，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
(续)Hadoop相应组件的搭建
CSDN-Ada助手: 恭喜用户在博客上持续更新，分享关于Hadoop相应组件搭建的经验！接下来，希望用户可以进一步深入探讨每个组件的具体配置和优化方法，这样读者可以更全面地了解和应用这些知识。希望用户能够不断学习，不断进步，为大家带来更多有价值的内容。期待您的下一篇博客！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。