大数据学习-Spark环境配置&官方示例SparkPi

最新推荐文章于 2024-05-06 14:39:40 发布

WeixinX_

最新推荐文章于 2024-05-06 14:39:40 发布

阅读量1.8k

点赞数 2

分类专栏：大数据文章标签： spark hadoop

本文链接：https://blog.csdn.net/mallolongzuo/article/details/108493977

版权

大数据专栏收录该内容

9 篇文章 0 订阅

订阅专栏

Spark环境配置

文章目录

Spark环境配置

1、压缩包下载

scala下载地址：https://www.scala-lang.org/download/

所选择版本为 scala-2.13.3.tgz

spark下载地址：http://spark.apache.org/downloads.html

所选择的版本为 spark-3.0.0-bin-hadoop2.7.gz

将压缩包上传到三台机器上(三台机器都需要配置，也可以采用先配置一台再分发文件的方式)

2、解压安装

tar -zxf /bigdata/soft/scala-2.13.3.tgz -C /bigdata/install

tar -zxf /bigdata/soft/spark-3.0.0-bin-hadoop2.7.gz -C /bigdata/install

3、修改配置文件

1）添加环境变量

vi ~/.bashrc

添加以下内容

export SCALA_HOME=/bigdata/install/scala-2.13.3
export SPARK_HOME=/bigdata/install/spark-3.0.0-bin-hadoop2.7
export PATH=$PATH:$SCALA_HOME/bin:$SPARK_HOME=/bin

保存退出后，执行

source ~/.bashrc

2）配置spark-env.sh文件

cd /bigdata/install/spark-3.0.0-bin-hadoop2.7/conf
cp spark-env.sh.template spark-env.sh

修改spark-env.sh文件

vi spark-env.sh
#添加以下内容
export JAVA_HOME=/bigdata/install/jdk1.8.0_141
export HADOOP_HOME=/bigdata/install/hadoop-2.6.0-cdh5.14.2
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export SCALA_HOME=/bigdata/install/scala-2.13.3
export SCALA_MASTER_IP=master
export SPARK_WORKER_MEMORY=2g

注意：jdk、hadoop这些环境变量的配置与你之前安装的路径和版本有关

3）配置slaves文件

cd /bigdata/install/spark-3.0.0-bin-hadoop2.7/conf
cp slaves.template slaves
vi slaves

添加内容如下

（注意把原来的 localhost 注释或删掉）

master
slave1
slave2

4、启动spark集群

在 master 机器下执行以下命令

1）启动hadoop

start-all.sh

2）启动spark

/bigdata/install/spark-3.0.0-bin-hadoop2.7/sbin/start-all.sh

3）查看进程

jps

在这里插入图片描述

4）查看spark集群运行信息

打开浏览器输入http://192.168.49.130:8080/

（该地址为之前配置CentOs时所设定的master的ip）
在这里插入图片描述

5、运行官方示例

使用spark官方示例SparkPi

首先进入spark目录下，执行以下命令

bin/spark-submit \
--class org.apache.spark.examples.SparkPi \
--master spark://master:7077 \
--executor-memory 1G \
--total-executor-cores 1 \
examples/jars/spark-examples_2.12-3.0.0.jar \
10

说明：

1）–master spark://master:7077：指定Master的地址是master节点

2）–executor-memory 1G --total-executor-cores 1：指定每个executor的可用内存为1GB

3）–total-executor-cores 1：指定每个executor使用的CPU核心数为1个

在这里插入图片描述

查看正在运行的应用

在这里插入图片描述

查看运行完毕的应用

在这里插入图片描述

运行结果

WeixinX_

关注

2
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
大数据学习-Spark环境配置&官方示例SparkPi

Spark环境配置文章目录Spark环境配置1、压缩包下载2、解压安装3、修改配置文件1）添加环境变量2）配置spark-env.sh文件3）配置slaves文件4、启动spark集群1）启动hadoop2）启动spark3）查看进程4）查看spark集群运行信息1、压缩包下载scala下载地址：https://www.scala-lang.org/download/所选择版本为 scala-2.13.3.tgzspark下载地址：http://spark.apache.org/downloads
复制链接

扫一扫