CentOS7 基于 Hadoo2.7.3 安装spark2.4.3 以及安装 scala
0x00准备
0x01 前提
确保Hadoop2.7.3完全分布式集群可正常使用
笔者已配置环境如下:
JDK版本:jdk1.8.0_121
Hadoop版本:hadoop-2.7.3
三台服务器ip分布如下
10.1.1.91 hadoop01 #主
10.1.1.92 hadoop02 #从
10.1.1.93 hadoop03 #从
启动Hadoop
start-all.sh
#
# 用jps查看主节点有如下活动
8227 DataNode
8580 ResourceManager
8692 NodeManager
8901 Jps
8122 NameNode
8397 SecondaryNameNode
#
# 用jps查看从节点
7430 Jps
7197 DataNode
7309 NodeManager
0x02 下载 Spark 安装包
Spark官方下载地址:https://spark.apache.org/downloads.html
- 选择版本号,如2.4.3
- 选择包类型,如Pre-buillt for Apache Hadoop 2.7 and later
- 点击下载进入下载页面
选择建议镜像下载地址进行下载:
0x03 下载 Scala 安装包
Scala官方下载地址:https://www.scala-lang.org/download/2.12.8.html
- 打开页面滑动至底部
- 选择包类型,如scala-2.12.8.tgz
0x10安装配置Scala
在主节点完成以下配置
- 解压Scala的tgz包到路径/opt/module
tar -xvf scala-2.12.8.tgz -C /opt/module
- 编辑/etc/profile(在文本末尾添加),配置系统环境变量
#