Spark<集群搭建Centos7.3+Spark2.1.1>

最新推荐文章于 2024-01-14 21:56:37 发布

Gpwner

最新推荐文章于 2024-01-14 21:56:37 发布

阅读量1.5k

点赞数

分类专栏： spark 文章标签： spark

本文链接：https://blog.csdn.net/Gpwner/article/details/73065469

版权

spark 专栏收录该内容

16 篇文章 1 订阅

订阅专栏

本集群搭建依赖于：

VMware Workstation12 Pro

SecureCRT 7.3

Xftp 5

CentOS-7-x86_64-Everything-1611.iso

hadoop-2.8.0.tar.gz

jdk-8u121-linux-x64.tar.gz

spark-2.1.1-bin-hadoop2.7.tgz

有关虚拟机和Hadoop的安装点击这里

IP	role
172.17.11.85	master、worker
172.17.11.86	worker
172.17.11.87	worker

1.在官网上下载最新稳定版Spark之后，上传到集群中的master/usr/local目录下，之后使用tar命令解压然后使用scp命令分发到其余机器上的相同目录，然后重命名为spark
2.进入/usr/local/spark/conf下将两个模板文件分别重命名为spark-env.sh、slaves
这里写图片描述
spark-env.sh

export JAVA_HOME=/usr/local/java/jdk1.8.0_131
export SPARK_MASTER_HOST=172.17.11.85
export SPARK_MASTER_PORT=7077
export SPARK_WORKER_CORES=2
export SPARK_WORKER_INSTANCES=1
export SPARK_WORKER_MEMORY=3g

这里写图片描述

slaves

172.17.11.85
172.17.11.86
172.17.11.87

这里写图片描述

3.local模式
创建/root/file.txt文件
这里写图片描述
启动local模式

读取本地文件，做wordcount
这里写图片描述
读取hdfs文件做wordcount

这里写图片描述

UI
这里写图片描述

4.standalone模式

cd /usr/local/spark

sbin/start-all.sh

这里写图片描述

读取hdfs文件做wordcount
这里写图片描述

读取本地文件做wordcount（三台机器相同路径下都要有file.txt）
这里写图片描述

Gpwner

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Spark<集群搭建Centos7.3+Spark2.1.1>

本集群搭建依赖于：VMware Workstation12 ProSecureCRT 7.3Xftp 5CentOS-7-x86_64-Everything-1611.isohadoop-2.8.0.tar.gzjdk-8u121-linux-x64.tar.gzspark-2.1.1-bin-hadoop2.7.tgz有关虚拟机和Hadoop的安装点击这里 IP role 172.17.
复制链接

扫一扫

专栏目录