spark(4)-高可用HA zookeeper原理及环境搭建

1. Spark集群模式及原理

1.1 spark集群示意图



1.2 zookeeper协调spark

        Spark本身是Master/Slaves结构的,有一个中心节点(Master),Master负责Spark集群的资源调度和分配。其余的是Worker。
        Worker管理单个节点上的资源状况。这里说的资源主要指CPU、内存,当然也包括disk IO,网络IO等。
        所谓Active级别的Master就是说现在正在管理集群,并接受外界程序提交请求和资源分配请求的Master。StandBy就是随时准备在Active Master挂掉后切换成Active级别,供集群资源分配需要及提交程序注册程序的需要。使用zookeeper做HA,做成3台机器,Active Master就是Leader。

       Zookeeper(资源协同的框架)中包含的有哪些内容?=>所有的Worker、Driver、Application. Driver代表了正在运行的程序。Application是应用程序本身。这些信息都会交给Zookeeper。

       Master切换时会不会影响application?不会,因为程序运行前已经向master申请过资源了。申请过后就是Driver与Executors之间的通信,这个过程一般不需要Master参与,除非executor有故障。这就是粗粒度,好处是一次性分配资源好后,不需要再关心资源的分配,而在作业运行过程中可以让driver和executors交互,完成作业或程序运行。

2. Zookeeper配置

2.1 zookeeper安装及初始配置

       说明:Zookeeper是与其他组件完全独立的组件。官网:http://zookeeper.apache.org/
       ① 三台机器下载配置$ZOOKEEPER_HOME及$PATH

[root@master-1a zookeeper]# vim /etc/profile 
#config zookeeper
export ZOOKEEPER_HOME=/usr/hadoop-env/.version/zookeeper-3.4.10
export PATH=$PATH:$ZOOKEEPER_HOME/bin:$ZOOKEEPER_HOME/conf

[root@master-1a zookeeper]# cd $ZOOKEEPER_HOME 
[root@master-1a zookeeper-3.4.10]# pwd
/usr/hadoop-env/.version/zookeeper-3.4.10
       ② 修改默认的数据及日志存储路径(cp conf下的样例配置为zoo.cfg)

[root@master-1a zookeeper-3.4.10]# cd conf/
[root@master-1a conf]# vim zoo.cfg

dataDir=/usr/hadoop-env/.version/zookeeper-3.4.10/data
dataLogDir=/usr/hadoop-env/.version/zookeeper-3.4.10/logs

#master-1a、slave01-02三台机器上都装了Zookeeper
server.0=master-1a:2888:3888
server.1=slave-01:2888:3888
server.2=slave-02:2888:3888      
 并建立对应的data和logs目录。
        ③ 进入data,创建myid,设置myid里的值0(对应conf中的server.0)直接写0即可

[root@master-1a data]# vim myid
0
        ④ 其他两台配置相同,注意修改myid分别为12


2.2 启动zookeeper


[root@master-1a bin]# cd $ZOOKEEPER_HOME 
[root@master-1a zookeeper-3.4.10]# ./bin/zkServer.sh start
ZooKeeper JMX enabled by default
Using config: /usr/hadoop-env/.version/zookeeper-3.4.10/bin/../conf/zoo.cfg
Starting zookeeper ... already running as process 3187.
        ① 同样命令将他两台启动。使用jps可以看到三台机器上都有QuorumPeerMain进程

        ② 相关命令

./bin/zkServer.sh start     #启动
./bin/zkServer.sh status    #查看leader还是follower
./bin/zkServer.sh stop
        ④ 下边的一个小测验为:关闭leader的所在机器。再查看另外两台机器,将会有一台变为leader

[root@slave-01 zookeeper-3.4.10]# ./bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/hadoop-env/.version/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: leader      #slave-01为leader
[root@slave-01 zookeeper-3.4.10]# ./bin/zkServer.sh stop #停止该leader
ZooKeeper JMX enabled by default
Using config: /usr/hadoop-env/.version/zookeeper-3.4.10/bin/../conf/zoo.cfg
Stopping zookeeper ... STOPPED
[root@master-1a zookeeper-3.4.10]# ./bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/hadoop-env/.version/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: follower
[root@master-1a zookeeper-3.4.10]# ./bin/zkServer.sh status  #该机器仍然为follower
ZooKeeper JMX enabled by default
Using config: /usr/hadoop-env/.version/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: follower
[root@slave-02 zookeeper-3.4.10]# ./bin/zkServer.sh status
ZooKeeper JMX enabled by default
Using config: /usr/hadoop-env/.version/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: follower
[root@slave-02 zookeeper-3.4.10]# ./bin/zkServer.sh status  #slave-01停止后,slave-02有幸选为leader
ZooKeeper JMX enabled by default
Using config: /usr/hadoop-env/.version/zookeeper-3.4.10/bin/../conf/zoo.cfg
Mode: leader

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值