Saprk运行环境配置

最新推荐文章于 2024-09-06 09:12:37 发布

XTJY_01

最新推荐文章于 2024-09-06 09:12:37 发布

阅读量163

点赞数

文章标签： spark scala

本文链接：https://blog.csdn.net/XTJY_01/article/details/120040268

版权

本文档详细介绍了如何在Linux环境中搭建Spark运行环境。首先从官网下载Spark和Scala的安装包，然后将其导入并解压。接着，修改系统profile，设置环境变量。在配置文件中指定相关路径，并修改spark-env.sh和log4j.properties。最后，启动Spark集群以验证安装的完整性。

摘要由CSDN通过智能技术生成

掌握Spark运行环境

掌握Spark运行环境的搭建

掌握运行环境的验证

1.在官网下载所需要的安装包，spark-3.1.1-bin-hadoop2.7，scala-2.13.6，然后导入到linux操作系统中的相应位置中，然后开始解压。

tar -zxvf spark

tar -zxvf scala

2.解压完毕后开始修改profile（将下列信息填入profile配置文件中）

vim /etc/profile

SCALA_HOME=/hadoop/software/scala-2.13.6
SPARK_HOME=/hadoop/software/spark-3.1.2-bin-hadoop2.7/sbin
export PATH=$JAVA_HOME:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH:$HBASE_HOME:$PATH
export PATH=$PATH:$SPARK_HOME/bin:$SPARK_HOME/sbin:$PATH:$SCALA_HOME/bin:$PATH

3.修改spark配置文件

（1）复制文件并重新命名

cp spark-env.sh.template spark-env.sh

cp log4j.properties.template log4j.properties

（2）修改slaves

export JAVA_HOME=/hadoop/software/jdk1.8.0_231
export SCALA_HOME=/hadoop/software/spark/scala-2.13.6
export HADOOP_HOME=/hadoop/software/hadoop-2.7.1
export SPARK_MASTER_IP=192.168.116.134
export SPARK_WORKER_MEMORY=1024m
export SPARK_WORKER_CORES=2
export SPARK_WORKER_INSTANCES=1

4.启动spark验证完整性

./start-all.sh

XTJY_01

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Saprk运行环境配置

掌握Spark运行环境掌握Spark运行环境的搭建掌握运行环境的验证1.在官网下载所需要的安装包，spark-3.1.1-bin-hadoop2.7，scala-2.13.6，然后导入到linux操作系统中的相应位置中，然后开始解压。tar -zxvfsparktar -zxvf scala2.解压完毕后开始修改profile（将下列信息填入profile配置文件中）vim /etc/profileSCALA_HOME=/hadoop/software/scala-2.13.
复制链接

扫一扫