spark是由Scala写的,可以把Scala看做加强化的java语言
我选择的是Scala2.13.8+spark3.2.1+Hadoop2.10.1+hadoop2.10.1
在安装之前在opt目录下创建packages和programs文件夹,分别放压缩包和解压缩后的文件。
1.安装Scala
在安装Scala之前需要jdk8环境,自行百度配置。
官网下载链接https://downloads.lightbend.com/scala/2.13.8/scala-2.13.8.tgz
下载好之后用Finashell连接centos7上传到/opt/packages文件夹下
Finashell下载及使用
进入压缩包所在的文件夹
cd /opt/packages
解压缩到programs文件夹
tar -zxvf scala-2.13.8.tgz -C /opt/programs
配置Scala的环境变量
vim /etc/profile
点击“i”键编辑,在文件末尾加上
export PATH=$PATH:/opt/programs/scala-2.13.8/bin
然后点击Esc,然后“:wq”保存并退出
执行source /etc/profile
刷新环境配置
执行scala出现以下内容说明安装成功
Ctrl+c退出scala
2.安装spark
官方下载链接https://dlcdn.apache.org/spark/spark-3.2.1/spark-3.2.1-bin-hadoop2.7.tgz
下载好之后用Finashell连接centos7上传到/opt/packages文件夹下
进入压缩包所在的文件夹
cd /opt/packages
解压缩到programs文件夹
tar -zxvf spark-3.2.1-bin-hadoop2.7.tgz -C /opt/programs
配置Spark的环境变量
vim /etc/profile
点击“i”键编辑,在文件末尾加上
export PATH=$PATH:/opt/programs/spark-3.2.1-bin-hadoop2.7/bin
然后点击Esc,然后“:wq”保存并退出
执行source /etc/profile
刷新环境配置
执行spark-shell出现以下内容说明安装成功
3.安装hadoop
官方下载链接https://archive.apache.org/dist/hadoop/common/hadoop-2.10.1/hadoop-2.10.1.tar.gz
下载好之后用Finashell连接centos7上传到/opt/packages文件夹下
进入压缩包所在的文件夹
cd /opt/packages
解压缩到programs文件夹
tar -zxvf hadoop-2.10.1.tar.gz -C /opt/programs
配置Hadoop的环境变量
vim /etc/profile
点击“i”键编辑,在文件末尾加上以下两行
export HADOOP_HOME=/opt/programs/hadoop-2.10.1
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin
然后点击Esc,然后“:wq”保存并退出
执行source /etc/profile
刷新环境配置
执行hadoop version
出现版本说明成功。