Linux安装 spark 教程详解

目录

一 准备安装包

二 安装 scala

三 修改配置文件

1)修改 workers 文件

2)修改 spark-env.sh文件

四 进入 spark 交互式平台


一 准备安装包

        可以自行去 spark 官网下载想要的版本

        这里准备了 spark3.1.2的网盘资源

链接: https://pan.baidu.com/s/1Brm6XqaqYQnXQwOd8mUt7A?pwd=2bye 提取码: 2bye

        下载后上传至 linux 服务器上

        这里放在了 /opt/install 目录

        解压至 /opt/soft 目录

tar -zxf /opt/install/spark-3.1.2-bin-hadoop3.2.tgz -C /opt/soft/

        改个名

cd /opt/soft
mv spark-3.1.2-bin-hadoop3.2/ spark312

        修改一下环境变量 

#SPARK_HOME
export SPARK_HOME=/opt/soft/spark312
export PATH=$SPARK_HOME/bin:$PATH

二 安装 scala

        安装过scala的 朋友可以跳过此步骤

        scala 的安装比较简单,spark 的运行环境需要 scala

        这里同样准备了网盘资源

链接: https://pan.baidu.com/s/1ua01OvTYjFQyG82AG1g1yg?pwd=imc6 提取码: imc6

        下载后上传至 linux 服务器上

        这里放在了 /opt/install 目录

        解压至 /opt/soft 目录

tar -zxf /opt/install/scala-2.12.10.tgz -C /opt/soft/

        解压后改个名

mv scala-2.12.10/ scala212

        修改环境变量,末尾添加下面内容

#SCALA_HOME
export SCALA_HOME=/opt/soft/scala212
export PATH=$SCALA_HOME/bin:$PATH

        修改后保存退出,source一下

 source /etc/profile

三 修改配置文件

        进入 spark312/conf 目录

        将 两个临时文件cp 一下

cp spark-env.sh.template spark-env.sh
cp workers.template workers

1)修改 workers 文件

vim workers

        由于这里就是单机版,所以就不做修改

 

2)修改 spark-env.sh文件

vim spark-env.sh

         添加配置,这里根据自己的各个安装包的位置来

export SCALA_HOME=/opt/soft/scala212
export JAVA_HOME=/opt/soft/jdk180
export SPARK_HOME=/opt/soft/spark312
export HADOOP_INSTALL=/opt/soft/hadoop313
export HADOOP_CONF_DIR=$HADOOP_INSTALL/etc/hadoop
export SPARK_MASTER_IP=172.25.38.169
export SPARK_DRIVER_MEMORY=2G
export SPARK_EXECUTOR_MEMORY=2G
export SPARK_LOCAL_DIRS=/opt/soft/spark312

四 进入 spark 交互式平台

        输入命令回车

 spark-shell

         未给参数默认等同于下面的命令 

spark-shell --master local[*]

         创建一个 RDD

sc.parallelize(1 to 10,3)

  • 2
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
1. 下载Spark:首先,从Spark官网下载最新版本的Spark。下载完成后,将Spark解压缩到您选择的目录中。 2. 安装Java:Spark需要Java环境才能运行。如果您的系统上没有Java,请先安装Java。 3. 配置环境变量:为了使Spark能够在任何地方运行,您需要将Spark的bin目录添加到系统的PATH环境变量中。在Linux系统上,可以通过编辑~/.bashrc文件来实现这一点。在文件的末尾添加以下行: export PATH=$PATH:/path/to/spark/bin 4. 启动Spark:现在,您可以启动Spark了。在终端中,进入Spark目录并运行以下命令: ./bin/spark-shell 这将启动Spark Shell,您可以在其中运行Spark应用程序。 5. 配置Spark:如果您需要更改Spark的配置,可以编辑Spark的conf目录中的spark-defaults.conf文件。在此文件中,您可以设置Spark的各种配置选项,例如内存分配和日志级别。 6. 运行Spark应用程序:要运行Spark应用程序,您需要编写一个Spark应用程序并将其提交给Spark。您可以使用Scala、Java或Python编写Spark应用程序。在提交应用程序之前,您需要启动Spark的Master节点。在终端中,进入Spark目录并运行以下命令: ./sbin/start-master.sh 然后,您可以使用以下命令提交应用程序: ./bin/spark-submit --class com.example.MyApp /path/to/my/app.jar 这将提交名为MyApp的应用程序,该应用程序位于/app.jar文件中。 7. 监视Spark:您可以使用Spark的Web界面来监视Spark应用程序的运行情况。在浏览器中,输入以下URL: http://localhost:404 这将打开Spark的Web界面,您可以在其中查看Spark应用程序的运行情况、任务进度和日志。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值