Spark伪分布安装

最新推荐文章于 2024-04-25 17:20:34 发布

qnvhuang

最新推荐文章于 2024-04-25 17:20:34 发布

阅读量535

点赞数

分类专栏：分布式计算原理笔记文章标签： Spark安装

本文链接：https://blog.csdn.net/qnvhuang/article/details/100109691

版权

4 篇文章 0 订阅

订阅专栏

Spark standalone 伪分布安装

虚拟机CentOS7 系统
预先伪分布装完整了Hadoop及JDK
安装spark-2.1.0-bin-hadoop2.7.tgz

在这里插入图片描述

将压缩包上传至 /tools目录，解压到/training 目录。
tar -zxvf spark-2.1.0-bin-hadoop2.7.tgz -C /training/
- 进入Spark安装目录 /conf ，配置：
注：/conf 下只有spark-env.sh.template 及 slaves.template ，自行拷贝重命名。

    cp slaves.template ./slaves
    cp spark-env.sh.template ./spark-env.sh

spark-env.sh：打开这个文件，添加如下

   export JAVA_HOME=/training/jdk1.8.0_171
   export SPARK_MASTER_HOST=nick01
   export SPARK_MASTER_PORT=7077

注：jdk1.8.0_171为安装jdk版本，nick01为主机名，7077为Spark-Master端口号。
- slaves：
vi slaves
将里面的localhost更改为主机名

关注

专栏目录