什么是zookerper
Zookeeper是一个分布式协调服务(第三方);就是为用户的分布式应用程序提供协调服务。
本身也是一个分布式程序。
Zookeeper本身就是一个分布式程序(只要有半数以上节点存活,zk就能正常服务)。
主要提供两个功能。
管理(存储,读取)用户程序提交的数据(数据大部分都为状态数据,所以zk的负载不会很大);
并为用户程序提供数据节点监听服务;
大数据中很多使用zk进行协调工作。不只是大数据,只要是分布式系统,zk都可以使用。
集群结构
采用Zab投票机制选出leader :以三个节点为例:
得到2票当选,规则是:每个节点每次只投一票;投票之后每个节点能知道投票结果,也就是可以知道其他节点的信息;每次投票投给id大的节点;选出当选的leader之后,其他再加入的节点默认成为follower。
此算法leader要让所有的节点数据同步,如果集群很大需要的时间会很多,所以zk不适合很大,数据更新很频繁的集群。
安装zookeeper
说明:博主选择了只在一台虚拟机下面安装多个zookeeper,使用不同的端口,模拟分布式,节省内存。
1.上传,解压,创建文件夹zk存储3个zookeeper。
2.修改配置文件
cd /home/admin/apps/zookeeper-3.4.5/conf
由于sample不生效,所以拷贝一份:cp zoo_sample.cfg zoo.cfg
3.修改每个zoo.cfg
修改后的配置文件:修改了端口号;数据存放位置;配置集群信息。
4.创建数据存放的文件夹,在文件下下面写入myid
mkdir /root/zkdata1
echo 1 > myid
5.其他zk同理写入
6.运行测试:
启动:cd zk/bin/ ./zsServer.sh start
查看状态:./zkServer.sh status
根据之前的算法描述,id为2的成为leader
zookeeper使用
1.连接客户端 ./zkCli.sh
切换连接:connect ip:端口