Linux 安装spark教程

Linux Spark的安装教程

安装JDK

  1. 下载JDK: jdk-8u152-linux-x64.tar.gz
    链接: https://pan.baidu.com/s/1d1lEELsUrXAQ–sf_PDBtg
    提取码: ib5x
  2. 解压 : jdk-8u152-linux-x64.tar.gz
    可以新建一个文件夹,命名为 java,然后将安装包放在这个新建的文件夹中,有助于文件管理。
    命令中输入:
tar zxvf jdk-8u152-linux-x64.tar.gz
  1. 配置环境变量,命令行输入:
    编辑环境变量
sudo vim /etc/profile

vim命令:
i 插入,编辑
esc 退出编辑
shift+q 退出vim
wq 保存并退出(或者 :x)
在profile文件中添加如下环境变量即可

#JAVA Env
export JAVA_HOME=/home/mao/java/jdk1.8.0_152
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_HOME/bin

添加完成后在终端命令行中输入:
刷新环境变量配置,让其立即生效

source /etc/profile
  1. 检验java是否安装成功,命令行输入:
Java -version

如果出现👇,恭喜安装成功啦

java version "1.8.0_152
Java(TM) SE Runtime Environment (build 1.8.0_152-b16)
Java HotSpot(TM) 64-Bit Server VM (build 25.152-b16 mixed mode)

到这里,Java环境配置好。

安装Scala

  1. 下载scala:
    https://downloads.lightbend.com/scala/2.13.3/scala-2.13.3.tgz
  2. 解压:scala-2.13.3.tgz
    同Java方法一样,新建一个文件夹scala,然后将安装好
    终端中输入:
tar zxvf scala-2.13.3.tgz
  1. 配置环境:终端输入 sudo vim/etc/profile

环境变量添加如下:

#Scala Env
export PATH="$PATH:/home/mao/scala/scala-2.13.3/bin"

:x 保存退出
然后 终端 输入 : source / etc/profile 立即生效
4. 检验是否安装成功

$ scala
Welcome to Scala version 2.13.3(Java HotSpot(TM) 64-Bit Server VM, Java 1.8.0_152).
Type in expressions to have them evaluated.
Type :help for more information.

安装成功。

安装Spark

  1. 下载Spark:http://spark.apache.org/downloads.html
  2. 解压:spark-3.0.0-bin-hadoop2.7.tgz
tar –zxvf spark-3.0.0-bin-hadoop2.7.tgz
  1. 编辑环境变量:
sudo vim /etc/profile

文末添加:

#spark env
export PATH="$PATH:/home/mao/spark/spark-3.0.0-bin-hadoop2.7/bin"

再source /etc/profile

  1. 检验是否成功安装spark
    终端输入:
spark-shell

输出:
在这里插入图片描述
安装成功!
初步环境安装过程记录,下期再开始学着写代码。

  • 5
    点赞
  • 33
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
1. 下载Spark:首先,从Spark官网下载最新版本的Spark。下载完成后,将Spark解压缩到您选择的目录中。 2. 安装Java:Spark需要Java环境才能运行。如果您的系统上没有Java,请先安装Java。 3. 配置环境变量:为了使Spark能够在任何地方运行,您需要将Sparkbin目录添加到系统的PATH环境变量中。在Linux系统上,可以通过编辑~/.bashrc文件来实现这一点。在文件的末尾添加以下行: export PATH=$PATH:/path/to/spark/bin 4. 启动Spark:现在,您可以启动Spark了。在终端中,进入Spark目录并运行以下命令: ./bin/spark-shell 这将启动Spark Shell,您可以在其中运行Spark应用程序。 5. 配置Spark:如果您需要更改Spark的配置,可以编辑Spark的conf目录中的spark-defaults.conf文件。在此文件中,您可以设置Spark的各种配置选项,例如内存分配和日志级别。 6. 运行Spark应用程序:要运行Spark应用程序,您需要编写一个Spark应用程序并将其提交给Spark。您可以使用Scala、Java或Python编写Spark应用程序。在提交应用程序之前,您需要启动Spark的Master节点。在终端中,进入Spark目录并运行以下命令: ./sbin/start-master.sh 然后,您可以使用以下命令提交应用程序: ./bin/spark-submit --class com.example.MyApp /path/to/my/app.jar 这将提交名为MyApp的应用程序,该应用程序位于/app.jar文件中。 7. 监视Spark:您可以使用Spark的Web界面来监视Spark应用程序的运行情况。在浏览器中,输入以下URL: http://localhost:404 这将打开Spark的Web界面,您可以在其中查看Spark应用程序的运行情况、任务进度和日志。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值