CentOS 7基于 Hadoo2.7.3完全分布式集群安装配置 spark2.4.3 以及安装 scala

最新推荐文章于 2022-02-26 21:42:56 发布

7INrelief

最新推荐文章于 2022-02-26 21:42:56 发布

阅读量886

点赞数 1

分类专栏：大数据技术文章标签： Hadoop spark

本文链接：https://blog.csdn.net/u010360923/article/details/90290242

版权

该博客详细介绍了如何在CentOS 7环境下，基于已有的Hadoop 2.7.3完全分布式集群，安装并配置Spark 2.4.3以及Scala。首先，博主提供了下载Spark和Scala的官方链接，然后在主节点上完成Scala的安装和环境变量配置。接着，博主详细讲述了Spark的安装步骤，包括解压、配置环境变量、修改spark-env.sh和slaves文件，并将所有配置复制到从节点。最后，启动Spark并使用jps检查集群状态，确认Master和Worker正常运行。

摘要由CSDN通过智能技术生成

CentOS7 基于 Hadoo2.7.3 安装spark2.4.3 以及安装 scala

0x00准备
0x10安装配置Scala
0x20 安装配置Spark
0x30 将以上安装以及配置从主节点拷贝的从节点
0x40 启动Spark
- 0x41 启动spark(在此之前Hadoop已启动)
- 0x42 jps 查看主从集群已有活动
0x50 参考

0x00准备

0x01 前提

确保Hadoop2.7.3完全分布式集群可正常使用
笔者已配置环境如下：
JDK版本:jdk1.8.0_121
Hadoop版本：hadoop-2.7.3
三台服务器ip分布如下

10.1.1.91	hadoop01 	#主
10.1.1.92 	hadoop02 	#从
10.1.1.93	hadoop03 	#从

启动Hadoop

start-all.sh
#
# 用jps查看主节点有如下活动
8227 DataNode
8580 ResourceManager
8692 NodeManager
8901 Jps
8122 NameNode
8397 SecondaryNameNode
#
# 用jps查看从节点
7430 Jps
7197 DataNode
7309 NodeManager

0x02 下载 Spark 安装包

Spark官方下载地址：https://spark.apache.org/downloads.html

选择版本号，如2.4.3
选择包类型，如Pre-buillt for Apache Hadoop 2.7 and later
点击下载进入下载页面

选择建议镜像下载地址进行下载：

0x03 下载 Scala 安装包

Scala官方下载地址：https://www.scala-lang.org/download/2.12.8.html

打开页面滑动至底部
选择包类型，如scala-2.12.8.tgz

0x10安装配置Scala

在主节点完成以下配置

解压Scala的tgz包到路径/opt/module

tar -xvf scala-2.12.8.tgz -C /opt/module

编辑/etc/profile(在文本末尾添加)，配置系统环境变量

最低0.47元/天解锁文章

7INrelief

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录