Spark2.1.0集群安装

最新推荐文章于 2022-05-05 16:06:32 发布

Knuth1989

最新推荐文章于 2022-05-05 16:06:32 发布

阅读量461

点赞数

分类专栏： spark 文章标签： spark scala big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/hanlanshenlan/article/details/121778225

版权

spark 专栏收录该内容

7 篇文章 0 订阅

订阅专栏

1. 安装Spark之前需要安装Java环境和Hadoop环境和Scala环境。

需要准备三台虚拟机

192.168.230.31 vm1

192.168.230.32 vm2

192.168.230.32 vm3

2. 安装Spark依赖的Scala，因为Spark依赖scala，所以在安装Spark之前，这里要先安装scala。

在每个节点上都进行安装。

a) 下载和解压缩 Scala, 打开地址： http://www.scala-lang.org/

直接打开下面的地址也可以：

Scala 2.12.2 | The Scala Programming Language

如图：

执行命令进行解压缩：

tar -xvf scala-2.12.2.tgz

b) 配置环境变量

编辑/etc/profile这个文件，在文件中增加一行配置：

export SCALA_HOME=/opt/scala/scala-2.12.2

在该文件的PATH变量中增加下面的内容： $SCALA_HOME/bin

环境变量配置完成后，执行下面的命令:

source /etc/profile

c) 验证Scala

scala -version

3. 下载和解压缩Spark

在每个节点上都安装Spark，也就是重复下面的步骤。

a)下载Spark压缩包

打开下载地址：Downloads | Apache Spark

b) 进入下载页面后，点击主页左侧的“Download”按钮进入下载页面，下载页面中提供了几个下

载选项，主要是Spark release及Package type的选择，如下图所示。第1项Spark release一般

默认选择最新的发行版本，如截止至2016年3月份的最新版本为3.1.2。第2项package type则

选择“Pre-build with user-provided Hadoop [can use with most Hadoop distributions]”，可适用

于多数Hadoop版本。选择好之后，再点击第4项给出的链接就可以下载Spark了。

若要下载老的版本，点击下方的Spark release archives即可

c) 来到下载页面选择需要的版本，点击下载即可

执行解压缩命令：

tar -zxvf spark-2.1.1-bin-hadoop2.7.tgz

d) 配置环境变量编辑/etc/profile文件，增加

export SPARK_HOME=/opt/spark/spark-2.1.1-bin-hadoop2.7

上面的变量添加完成后编辑该文件中的PATH变量，添加

$SPARK_HOME/bin

注意：因为$SPARK_HOME/sbin目录下有一些文件名称和$HADOOP_HOME/sbin目录下的文

件同名，为了避免同名文件冲突，这里不在PATH变量里添加$SPARK_HOME/sbin只添加了

$SPARK_HOME/bin

编辑完成后，执行命令：source /etc/profile

4. 配置conf目录下的文件

对/opt/spark-2.1.0-bin-hadoop2.7/conf目录下的文件进行配置。

a) 新建spark-env.h文件

执行命令，进入到/opt/spark-2.1.0 -bin-hadoop2.7/conf目录内：

cd /opt/spark-2.1.0-bin-hadoop2.7/conf

以spark为我们创建好的模板创建一个spark-env.h文件，命令是：

cp spark-env.sh.template spark-env.sh

编辑spark-env.sh文件，在里面加入配置(具体路径以自己的为准)：

b) 新建slaves文件

执行命令，进入到/opt/spark/spark-2.1.1-bin-hadoop2.7/conf目录内：

cd /opt/spark/spark-2.1.1-bin-hadoop2.7/conf

以spark为我们创建好的模板创建一个slaves文件，命令是：

cp slaves.template slaves

编辑slaves文件，里面的内容为：

5. 启动和测试Spark集群

a)启动Spark

因为spark是依赖于hadoop提供的分布式文件系统的，所以在启动spark之前，先确保hadoop在

正常运行。

在hadoop正常运行的情况下，在vm1（也就是hadoop的namenode，spark的master节点）上执

行命令： cd /opt/spark-2.1.0-bin-hadoop2.7/sbin

执行启动脚本： sh start-all.sh

b) jps查看进程

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Knuth1989 CSDN认证博客专家 CSDN认证企业博客

码龄16年

69: 原创

10万+: 周排名

188万+: 总排名

11万+: 访问

: 等级

1523: 积分

54: 粉丝

32: 获赞

15: 评论

99: 收藏

私信

关注

热门文章

分类专栏

zookeeper 1篇
计算机网络 1篇
word 1篇
linux 13篇
kafka 4篇
flume 3篇
hadoop 7篇
elasticsearch 4篇
spark 7篇
mysql 1篇
extjs 1篇
Java 9篇
hive 3篇
python 8篇
palo 1篇
机器学习 3篇
Intellij IDEA 3篇
hbase 1篇
Azkaban 2篇
高德地图 2篇
git 1篇
influxdb 1篇

最新评论

CentOS7安装Hadoop2.7.3完整步骤
Nomadoaix: 非常关键
linux 设置网络开虚拟机自动连接
rainbowcat66: 我的系统配置文件，改了之后忘了，我说怎么改不了 su root 输入你的密码 cd /etc/sysconfig/network-scripts/ ls vim /ifcfg-ens33 修改ONBOOT=yes service network restart 就不用重启
linux 设置网络开虚拟机自动连接
weixin_44106900: 不用每次都重新点开网络了,安逸
kafka里面的topic消费情况查看
biu_biu_duda: 一、zookeeper的启动与关闭 #启动zookeeper ./zkServer.sh start #查看zookeeper运行状态 ./zkServer.sh status #停止zookeeper服务 ./zkServer.sh stop 二、zookeeper的链连接与退出 #连接zookeeper服务 ./zkCli.sh -server 127.0.0.1:2181 #退出zookeeper客户端 quit 三、zookeeper常用操作 1、输入 help ，查看zookeeper所有命令 2、查看指定路径下包含的节点（目录列表） #查看根目录下包含的节点 ls / #查看节点状态信息 ls2 / #或者使用ls -s / 3、创建节点：复制代码 #创建一个非顺序的持久化节点 #create [-s] [-e] path data acl create /test test-1 #创建一个临时节点 create -e /test/tmp tem-data #创建一个顺序节点 create -s /test/aaa aaa-data 复制代码 4、删除一个节点 delete /test 博客里大都是转载的内容，其目的主要用户知识的组织和管理。
kafka里面的topic消费情况查看
weixin_37891192: 从ZK里查不出消费者，返回[]

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。