Spark2.2.0 + Scala2.13.0集群搭建

本篇博客详细介绍了如何在Ubuntu环境下搭建Spark 2.2.0集群,包括先安装Scala、JDK,再安装Spark,并进行相应配置。在主机master上执行安装和配置步骤,然后在集群中复制配置,最后通过Spark Web UI检查集群状态。整个过程参照了《循序渐进学spark》这本书。
摘要由CSDN通过智能技术生成

Spark使用了Hadoop的HDFS作为持久化存储层,因此安装Spark时,应先安装与Spark版本相对应的Hadoop。Spark计算框架以Scala语言开发,因此部署Spark首先需要安装Scala及JDK。

Hadoop集群参考: ubuntu16+Hadoop2.7.3环境搭建(伪分布式),改为分布式集群
JDK版本:1.8.0
Scala版本:scala-2.13.0-M1
spark版本:2.2.0(目前最新版本)

由于本机Hadoop集群搭建完成,所以这里不再赘述Hadoop集群。本机hadoop集群 (一主两被)
master:hadoopm
slave:hadoop_s1
slave:hadoop_s2

安装Scala

由上面给出的链接下载最新版scala。先在主机master(hadoopm)中安装。

安装

在下载目录下执行:
tar zxvf scala-2.13.0-M1.tgz -C /urs/local

配置

cd /etc/profile
末尾加入:


export SCALA_HOME=/usr/local/scala-2.13.0-M1
export PATH=${SCALA_HOMA}/bin:$PATH

安装spark

在上面的链接中下载最新版的sp

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值