大数据学习之路，Spark的介绍、部署以及wordcount实例的实现（1）

MC柱柱

已于 2022-04-10 13:39:39 修改

阅读量1.5k

点赞数

分类专栏：学习文章标签： spark 学习 scala

于 2022-04-10 04:35:16 首次发布

本文链接：https://blog.csdn.net/qq_42559628/article/details/124071290

版权

本文详细介绍了Apache Spark的简介，包括其作为多语言引擎的角色。接着，文章逐步指导如何安装和配置Scala环境，以及部署Spark 3.2.1。在配置完成后，作者通过wordcount实例验证了Spark的安装部署，还涵盖了History Server的配置，以保留任务历史记录。此外，文章还探讨了yarn-client和yarn-cluster模式的区别以及Driver和Executor的作用。

摘要由CSDN通过智能技术生成

Spark简介

什么是Spark？

Apache Spark是一种多语言引擎，用于在单节点机器或集群上执行数据工程、数据科学和机器学习。

Spark的安装

检查

检查HDFS、YARN环境

[vagary@vagary ~]$ jps
4736 NameNode
5490 NodeManager
5106 SecondaryNameNode
4870 DataNode
5881 Jps
5375 ResourceManager

检查Java环境

[vagary@vagary ~]$ java -version
java version "1.8.0_212"
Java(TM) SE Runtime Environment (build 1.8.0_212-b10)
Java HotSpot(TM) 64-Bit Server VM (build 25.212-b10, mixed mode)

Scala部署

下载Scala安装包

这些安装包在官网上都有
https://www.scala-lang.org/download/all.html，然后这里我们安装2.12.15版本的Scala

[vagary@vagary software]$ wget https://downloads.lightbend.com/scala/2.12.15/scala-2.12.15.tgz

解压Scala安装包

[vagary@vagary software]$ tar -zxvf scala-2.12.15.tgz -C ../app

创建软连接

[vagary@vagary app]$ ln -s scala-2.12.15 scala

配置环境变量

编辑全局变量文件，/etc/profile

[root@vagary ~]# vi /etc/profile

然后将环境变量加入

export SCALA_HOME=/home/vagary/app/scala
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$SCALA_HOME/bin:$PATH

配置完成退出后，使环境变量生效：

[root@vagary ~]# source /etc/profile

然后验证一下，出现版本号就表示配置成功：

[root@vagary ~]# scala -version
Scala code runner version 2.12.15 -- Copyright 2002-2021, LAMP/EPFL and Lightbend, Inc.

Spark部署

首先下载Spark安装包，从官网https://spark.apache.org/downloads.html上看版本很多，这里我们选择3.2.1的版本进行下载
在这里插入图片描述
注：我们Hadoop版本是3.1.3，然后这里下的spark是3.2.1，因为是自己学的，可以这么去用，如果服务器级别的开发是不能这么下载的，还是要下对应版本，或者预编译的。

预编译版的Spark

预编译好的，没有我们要的版本，所以我们要下载，从官网上下
https://spark.apache.org/downloads.html，版本很多，这里我们就用3.2.1，然后选择包类型为Source code,然后进行下载
在这里插入图片描述
解压之后进入dev目录下，修改make-distribution.sh文件

[vagary@vagary dev]$ vi make-distribution

最低0.47元/天解锁文章

MC柱柱

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录