搭建spark完全分布式

最新推荐文章于 2024-05-19 09:50:47 发布

kkongyu

最新推荐文章于 2024-05-19 09:50:47 发布

阅读量369

点赞数

分类专栏： spark 文章标签： spark

本文链接：https://blog.csdn.net/ting_163/article/details/80473833

版权

spark 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

安装spark

1.列表内容
spark下载：http://spark.apache.org/downloads.html
2.将spark进行解压：

 s100:/soft $>tar -zxvf spark-2.3.0-bin-hadoop2.7.tgz
 s100:/soft $> ln -s spark-2.3.0-bin-hadoop2.7 spark

3.配置环境变量

$> sudo nano /etc/environment

PATH = ':/soft/spark/bin:/soft/spark/sbin'
SPARK_HOME=/soft/spark
使配置生效： $> source /etc/environment

4.配置/spark/conf

 s100:/soft/spark/conf $> cp slaves.template slaves
 s100:/soft/spark/conf $> sudo nano slaves
在slaves文件下填上slave主机名：
s101
s102
s103

5.配置spark/sbin

 s100:/soft/spark/sbin $>mv start-all.sh start-spark-all.sh
 s100:/soft/spark/sbin $>mv stop-all.sh stop-spark-all.sh
原因：
如果集群中也配置HADOOP_HOME，那么在HADOOP_HOME/sbin目录下也有start-all.sh和stop-all.sh这两个文件，当你执行这两个文件，系统不知道是操作hadoop集群还是spark集群。修改后就不会冲突了，当然，不修改的话，你需要进入它们的sbin目录下执行这些文件，这肯定就不会发生冲突了。

6.配置集群

将以上配置分发到其他节点：s101,s102,s103

7.启动spark集群

s100:$> start-spark-all.sh
s100:$> jps
4064 Jps
3846 Master

8.webUI查看集群启动情况
这里写图片描述

kkongyu

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
搭建spark完全分布式

安装sparkspark下载：http://spark.apache.org/downloads.html将spark进行解压： /soft $&amp;amp;amp;amp;gt;tar -zxvf spark-2.3.0-bin-hadoop2.7.tgz /soft $&amp;amp;amp;amp;gt; ln -s spark-2.3.0-bin-hadoop2.7 spark配置环境变量 ...
复制链接

扫一扫

专栏目录