Spark 完全分布式集群搭建过程

最新推荐文章于 2024-04-18 18:49:13 发布

Ashely_Xie

最新推荐文章于 2024-04-18 18:49:13 发布

阅读量2.3k

点赞数

分类专栏： Spark 文章标签： spark hadoop scala 集群分布式

本文链接：https://blog.csdn.net/Ashely_Xie/article/details/78608097

版权

Spark2.1 +Hadoop2.6 搭建分布式集群

本篇博客由博主Ashely个人原创，如有转载，请注明出处：

ubuntu@vm06 192.168.110.106 master
ubuntu@vm05 192.168.110.105 slave1
ubuntu@vm04 192.168.110.104 slave2

Hadoop2.6.5 + Spark2.1.0 + Scala2.1.6

    --> 所有节点都执行

    --> 所有节点都执行

    --> master -> slave1、slave2 ;  slave1、slave2 -> master

    --> master先执行，再scp到slave1、slave2; 还要改些配置

    --> master先执行，再scp到slave1、slave2; 还要改些配置

ubuntu@vm06:~$ sudo vim /etc/hostname

改成master //其他两个分别改为slave1 和slave2
注意：本文的主机名全部以小写字母开头，后文在配置环境时注意不要误用大写！

ubuntu@vm06:~# sudo vim /etc/hosts

//将原文件（127.0.0.0 localhost）下面添加以下信息：

192.168.110.106 master
192.168.110.105 slave1
192.168.110.104 slave2

ubuntu@vm06:~# sudo source /etc/hosts

//退出后重启虚拟机

ubuntu@vm06:~# sudo reboot

//分别对集群中的所有节点进行以上相似的设置
这里写图片描述

-对所有节点安装java和scala

1）下载jdk-1.8并解压到 /usr/local

ubuntu@master:~$ sudo wget .............
ubuntu@master:~$ sudo tar -zxvf jdk-8u152-linux-x64.tar.gz -C /usr/local/

2）添加java环境变量，在/etc/profile中添加：

ubuntu@master:~$ sudo vim /etc/profile

export JAVA_HOME=/usr/local/jdk1.8.0_152
PATH=$JAVA_HOME/bin:$PATH
CLASSPATH=.:$JAVA_HOME/lib/rt.jar
export JAVA_HOME PATH CLASSPATH

3）保存后刷新配置

ubuntu@master:~$ source /etc/profile

这里写图片描述

1）下载scala安装包scala-2.10.6.tgz安装到 /usr/lib

ubuntu@master:~$ sudo tar -zxvf scala-2.10.6.tgz -C /usr/lib/

2）添加Scala环境变量，在/etc/profile中添加：

ubuntu@master:~# sudo vim /etc/profile

export SCALA_HOME=/usr/lib/scala-2.10.6
export PATH=$SCALA_HOME/bin:$PATH

3)保存后刷新

ubuntu@master:~# source /etc/profile

这里写图片描述

-对所有节点安装

关注