CentOS 7基于 Hadoo2.7.3完全分布式集群 安装配置 spark2.4.3 以及 安装 scala

该博客详细介绍了如何在CentOS 7环境下,基于已有的Hadoop 2.7.3完全分布式集群,安装并配置Spark 2.4.3以及Scala。首先,博主提供了下载Spark和Scala的官方链接,然后在主节点上完成Scala的安装和环境变量配置。接着,博主详细讲述了Spark的安装步骤,包括解压、配置环境变量、修改spark-env.sh和slaves文件,并将所有配置复制到从节点。最后,启动Spark并使用jps检查集群状态,确认Master和Worker正常运行。
摘要由CSDN通过智能技术生成

0x00准备

0x01 前提

确保Hadoop2.7.3完全分布式集群可正常使用
笔者已配置环境如下:
JDK版本:jdk1.8.0_121
Hadoop版本:hadoop-2.7.3
三台服务器ip分布如下

10.1.1.91	hadoop01 	#主
10.1.1.92 	hadoop02 	#从
10.1.1.93	hadoop03 	#从

启动Hadoop

start-all.sh
#
# 用jps查看主节点有如下活动
8227 DataNode
8580 ResourceManager
8692 NodeManager
8901 Jps
8122 NameNode
8397 SecondaryNameNode
#
# 用jps查看从节点
7430 Jps
7197 DataNode
7309 NodeManager

0x02 下载 Spark 安装包

Spark官方下载地址:https://spark.apache.org/downloads.html

  1. 选择版本号,如2.4.3
  2. 选择包类型,如Pre-buillt for Apache Hadoop 2.7 and later
  3. 点击下载进入下载页面
    在这里插入图片描述
    选择建议镜像下载地址进行下载:
    在这里插入图片描述

0x03 下载 Scala 安装包

Scala官方下载地址:https://www.scala-lang.org/download/2.12.8.html

  1. 打开页面滑动至底部
  2. 选择包类型,如scala-2.12.8.tgz
    在这里插入图片描述

0x10安装配置Scala

在主节点完成以下配置

  1. 解压Scala的tgz包到路径/opt/module
tar -xvf scala-2.12.8.tgz -C /opt/module
  1. 编辑/etc/profile(在文本末尾添加),配置系统环境变量
 # 
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值