spark搭建阿里云集群

最新推荐文章于 2024-07-13 16:26:36 发布

在下蔡江琪

最新推荐文章于 2024-07-13 16:26:36 发布

阅读量671

点赞数

分类专栏： spark

原文链接：https://blog.csdn.net/qq_43184146/article/details/100053219

版权

spark 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

因为现阶段使用到了spark，所以就想搭建spark集群平台在阿里云上，网上找了很多资料，发现每一个人写的都不太一样，试过几次发现搭建不成功，于是自己慢慢琢磨，总结他们的经验，最后自己成功搭建，写下此篇博客，防止以后再次需要搭建时遇到问题，以下为搭建步骤。

hadoop、scala集群安装成功

下载安装

官网下载地址：http://spark.apache.org/downloads.html

下载与hadoop对应版本的安装包，我的hadoop是2.7.6的所以下载 spark-2.4.3-bin-hadoop2.7.tgz

下载好后解压

tar -zxvf spark-2.4.3-bin-hadoop2.7.tgz

重命名

mv spark-2.4.3-bin-hadoop2.7 spark

配置环境变量

vi /etc/profile

export SPARK_HOME=/usr/spark
export PATH=$PATH:$SPARK_HOME/bin

使环境变量生效

source /etc/profile

进入到spark的conf文件下

cd spark/conf

mv spark-env.template spark-env.sh

mv log4j.properties.template log4j.properties

mv slaves.template slaves

修改spark-env.sh文件

vi spark-env.sh

加入以下配置

export SCALA_HOME=/usr/scala
export JAVA_HOME=/usr/jdk1.8.0_65
export HADOOP_CONF_DIR=/usr/hadoop/etc/hadoop

修改slaves文件

vi slaves

将localhost改为hadoop集群主机节点名

master

server1

server2

在集群其它节点上做同样操作或复制过去

scp -r spark/ server1:/usr/

scp -r spark/ server2:/usr/

应为与hadoop启动进程是同样命令，所以进到sbin文件下启动

cd spark/sbin

start-all.sh

jps查看master上是否有 Master和Worker

从节点上是否有Worker

阿里云开放端口8081、7077

阿里云spark集群搭建成功

在下蔡江琪

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
spark搭建阿里云集群

因为现阶段使用到了spark，所以就想搭建spark集群平台在阿里云上，网上找了很多资料，发现每一个人写的都不太一样，试过几次发现搭建不成功，于是自己慢慢琢磨，总结他们的经验，最后自己成功搭建，写下此篇博客，防止以后再次需要搭建时遇到问题，以下为搭建步骤。hadoop、scala集群安装成功下载安装官网下载地址：http://spark.apache.org/downloads.htm...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。