Maven安装编译Spark，搭建Spark独立集群模式（Hadoop架构之上）

最新推荐文章于 2022-07-11 14:54:52 发布

fuzuxian

最新推荐文章于 2022-07-11 14:54:52 发布

阅读量211

点赞数

本文链接：https://blog.csdn.net/image_fzx/article/details/79548163

版权

首先，你的几台电脑都装好了Hadoop，如果要搭建Spark独立集群模式，则需要每台电脑都装上Spark。

我是在主机Master下载了Maven，Spark 压缩包，

点project，

点 Maven，

点Download，

hadoop@Master:~$ ssh -X Slave2

hadoop@Slave2:~$ cd /etc
hadoop@Slave2:/etc$ sudo gedit environment

SPARK_HOME=/home/hadoop/software/spark-2.3.0

M2_HOME=/home/hadoop/software/apache-maven-3.5.2

在PATH后面添加 :/home/hadoop/software/spark-2.3.0/bin:/home/hadoop/software/apache-maven-3.5.2/bin

（注意每个·路径用冒号隔开）

电脑重启：

hadoop@Slave2:sudo reboot

export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M"

mvn -Pyarn -Phadoop-2.6 -Dhadoop.version=2.7.3  -DskipTests clean package

Slave0
Slave1
Slave2

/usr/local/sbin/xcp.sh slaves ~/software/spark-2.3.0/conf/

启动所有work的进程：

hadoop@Master:~/software/spark-2.3.0/sbin$ ./start-master.sh
hadoop@Master:~/software/spark-2.3.0/sbin$ ./start-slaves.sh

查看spark的web信息： http://Master:8080

如果要启动单个节点，则：

 ./start-slave.sh spark://Slave1:7077
jps
./stop-slave.sh

关注