初识ZooKeeper及其实战
1、初识ZooKeeper
1.1、ZooKeeper是什么?
Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目。
在分布式环境下,zookeeper可以说无处不在。它是Google的Chubby一个开源的实现,是一个分布式的、开源的程序协调服务,是 hadoop 项目下的一个子项目。它主要提供了配置管理、统一命名服务、分布式锁、集群管理等服务。从架构设计上来看,ZooKeeper主要分为两部分,文件系统和监听通知机制。ZooKeeper可作为SpringCloud的注册中心来使用。
1.2、特点
- ZooKeeper:一个领导者(Leader),多个跟随者(Follower)组成的集群。
- 集群中只要有半数以上节点存活,ZooKeeper集群就能正常服务。
- 全局数据一致:每个Server保存一份相同的数据副本,每个Client无论连接到哪个Server,数据都是一致的。
- 更新请求顺序进行,来自同一个Client的更新请求按其发送顺序依次执行。
- 数据更新原子性,一次数据更新要么成功,要么失败。
- 实时性,在一定范围内,Client能读到最新数据。
1.3、数据结构
ZooKeeper数据模型的结构与Unix文件系统很类似,整体上可以看作是一棵树,每个节点作为一个ZNode。为了保证高吞吐低延迟,ZooKeeper需要在内存中维护这个树状的目录结构,因此ZooKeeper不能存放大量的数据,每个节点的存放数据上限是1MB,每个ZNode都可以通过其路径唯一标识。
1.4、应用场景
提供的服务包括:统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下线、软负载均衡等。
- 统一命名服务:在分布式环境下,经常需要对应用/服务进行统一命名,便于识别。例如:IP不容易记住,而域名容易记住。
- 统一配置管理:分布式环境下,配置文件同步非常常见。如:一般要求一个集群中,所有节点的配置信息时一致的;对配置文件修改后,希望能够快速同步到各个节点上。配置管理可交由ZooKeeper实现。可将配置信息写入ZooKeeper上的Znode。各个客户端服务监听这个Znode。一旦Znode中的数据被修改,ZooKeeper将通知各个客户端服务器。
- 服务器动态上下线:客户端能实时洞察到服务器上下线的变化
- 软负载均衡:在ZooKeeper中记录每台服务器的访问数量,放访问数量最少的服务器去处理最新的客户端请求。
2、ZooKeeper安装
2.1、下载安装
下载地址:https://zookeeper.apache.org/
- 安装ZooKeeper前确保已经安装了JDK
- 解压ZooKeeper:
- 将zookeeper-3.4.10/conf这个路径下的zoo_sample.cfg修改为zoo.cfg
- 在/opt/module/zookeeper-3.4.10/这个目录上创建zkData文件夹并打开zoo.cfg文件,修改dataDir路径(zookeeper的数据存储位置),修改如下内容:
- 启动服务器
部署方式单机模式(Mode:standlone)、集群模式(Mode:leader或Mode:follower) - 启动客户端:
2.2、配置参数解读
Zookeeper中的配置文件zoo.cfg中参数含义解读如下:
- tickTime =2000:通信心跳数,Zookeeper服务器与客户端心跳时间,单位毫秒。
Zookeeper使用的基本时间,服务器之间或客户端与服务器之间维持心跳的时间间隔,也就是每个tickTime时间就会发送一个心跳,时间单位为毫秒。
它用于心跳机制,并且设置最小的session超时时间为两倍心跳时间。(session的最小超时时间是2*tickTime) - initLimit =10:LF初始通信时限
集群中的Follower跟随者服务器与Leader领导者服务器之间初始连接时能容忍的最多心跳数(tickTime的数量),用它来限定集群中的Zookeeper服务器连接到Leader的时限。 - syncLimit =5:LF同步通信时限
集群中Leader与Follower之间的最大响应时间单位,假如响应超过syncLimit * tickTime,Leader认为Follwer死掉,从服务器列表中删除Follwer。 - dataDir:数据文件目录+数据持久化路径
主要用于保存Zookeeper中的数据。 - clientPort =2181:客户端连接端口
监听客户端连接的端口。
3、ZooKeeper内部原理
3.1、选举机制
- 半数机制:集群中半数以上机器存活,集群可用。所以Zookeeper适合安装奇数台服务器。
- Zookeeper虽然在配置文件中并没有指定Master和Slave。但是,Zookeeper工作时,是有一个节点为Leader,其他则为Follower,Leader是通过内部的选举机制临时产生的。
3.2、节点类型
持久(Persistent): 客户端和服务器断开连接后,创建的节点不删除。
(1) 持久化目录节点:客户端与zookeeper断开连接后,该节点依旧存在
(2) 持久化顺序编号目录节点:客户端与zookeeper断开连接之后,该节点依旧存在,只是zookeeper该改节点名称进行顺序编号
短暂(Ephemeral): 客户端与服务器断开连接之后,创建的节点自己删除
(1)临时目录节点:客户端与zookeeper断开连接后,该节点删除
(2)临时顺序编号目录节点:客户端与zookeeper断开连接之后,该节点被删除,只是zookeeper给该节点名称进行顺序编号。
注:创建znode时设置顺序标识,znode名称后会附加一个值,顺序号是一个单调递增的计数器,由父节点维护。在分布式系统中,顺序号可以被用于为所有的时间进行全局排序,这样客户端可以通过顺序号推断时间的顺序。
3.3、结构体
1)czxid-创建节点的事务zxid
每次修改ZooKeeper状态都会收到一个zxid形式的时间戳,也就是ZooKeeper事务ID。
事务ID是ZooKeeper中所有修改总的次序。每个修改都有唯一的zxid,如果zxid1小于zxid2,那么zxid1在zxid2之前发生。
2)ctime - znode被创建的毫秒数(从1970年开始)
3)mzxid - znode最后更新的事务zxid
4)mtime - znode最后修改的毫秒数(从1970年开始)
5)pZxid-znode最后更新的子节点zxid
6)cversion - znode子节点变化号,znode子节点修改次数
7)dataversion - znode数据变化号
8)aclVersion - znode访问控制列表的变化号
9)ephemeralOwner- 如果是临时节点,这个是znode拥有者的session id。如果不是临时节点则是0。
10)dataLength- znode的数据长度
11)numChildren - znode子节点数量
3.4、监听器原理
- 在main线程中创建ZooKeeper客户端,这时就会创建两个线程,一个负责网络连接通信(connect),一个负责监听(listener)。
- 通过connect线程将注册的监听事件发送给ZooKeeper。
- 在ZooKeeper的注册监听器列表中将注册监听事件添加到列表中。
- ZooKeeper监听到有数据或路径(监听节点数据的变化:get path [watch],监听子节点增减的变化:ls path [watch])变化,就会将这个消息发送给listener线程。
3.5、写数据流程
4、ZooKeeper实战
4.1、分布式安装部署
- 把我们现在已经安装好的zookeeper同步到另外两台机器:
- 在/opt/module/zookeeper-3.4.10/zkData目录下创建一个myid的文件,并在文件中添加对应的编号:2,拷贝配置好的zookeeper到其他机器,并分别修改myid文件中的内容为:3,4。
- 修改zoo.cfg文件,增加如下配置,并同步zoo.cfg配置文件:
- 配置参数解读
server.A=B:C:D。
A是一个数字,表示这个是第几号服务器;
集群模式下配置一个文件myid,这个文件在dataDir目录下,这个文件里面有一个数据就是A的值,Zookeeper启动时读取此文件,拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是哪个server。
B是这个服务器的ip地址(也可以写服务器名);
C是这个服务器与集群中的Leader服务器交换信息的端口;
D是万一集群中的Leader服务器挂了,需要一个端口来重新进行选举,选出一个新的Leader,而这个端口就是用来执行选举时服务器相互通信的端口。
4.2、启动三台机器上的zookeeper并查看状态
4.3、客户端命令行操作
命令基本语法 | 功能描述 |
---|---|
help | 显示所有操作命令 |
ls path [watch] | 使用 ls 命令来查看当前znode中所包含的内容 |
ls2 path [watch] | 查看当前节点数据并能看到更新次数等数据 |
create | 普通创建-s 含有序列-e 临时(重启或者超时消失) |
get path [watch] | 获得节点的值 |
set | 设置节点的具体值 |
stat | 查看节点状态 |
delete | 删除节点 |
rmr | 递归删除节点 |
- 启动客户端
- 显示所有操作命令
- 查看当前znode中包含的内容
- 查看当前节点详细数据
- create命令分别创建2个普通节点:java、study,ls命令查看节点的值
- get命令获取节点数据:
- 创建短暂节点:ephemeralstudy,重启客户端后,该节点消失
- 创建带序号的节点
如果原来没有序号节点,序号从0开始依次递增。如果原节点下已有2个节点,则再排序时从2开始,以此类推。目前java下有三个节点
- 修改节点数据值
- 节点的值变化监听
在hadoop104主机上注册监听/java节点数据变化
在hadoop102主机上修改/java节点的数据
观察hadoop104主机收到数据变化的监听
注:可以看到,104机器上已经监听到了java节点值的更改,每次注册监听只能监听到一次节点的变化,如果需要再次监听需要再次注册 - 节点的子节点变化监听(路径变化)
在hadoop104主机上注册监听/java节点的子节点变化
在hadoop102主机/java节点上创建子节点
观察hadoop104主机收到子节点变化的监听
- delete命令删除节点
- rmr命令递归删除节点
- stat命令查看节点状态
4.4、API应用
- 在idea中创建一个maven工程,这里不再演示
- 添加pom文件
<dependencies>
<dependency>
<groupId>junit</groupId>
<artifactId>junit</artifactId>
<version>RELEASE</version>
</dependency>
<dependency>
<groupId>org.apache.logging.log4j</groupId>
<artifactId>log4j-core</artifactId>
<version>2.8.2</version>
</dependency>
<dependency>
<groupId>org.apache.zookeeper</groupId>
<artifactId>zookeeper</artifactId>
<version>3.4.10</version>
</dependency>
</dependencies>
- TestZookeeper测试类
public class TestZookeeper {
private String connectString="hadoop102:2181,hadoop103:2181,hadoop104:2181";
private int sessionTimeout=2000;
private ZooKeeper zkClient;
//公用获取链接
@Before
public void init() throws IOException {
zkClient= new ZooKeeper(connectString, sessionTimeout, new Watcher() {
public void process(WatchedEvent watchedEvent) {
List<String> children= null;
System.out.println("-----start-----");
// 收到事件通知后的回调函数(用户的业务逻辑)
System.out.println(watchedEvent.getType() + "--" + watchedEvent.getPath());
// 再次启动监听
try {
children = zkClient.getChildren("/",true);
for (String child:children){
System.out.println(child);
}
System.out.println("-----end-----");
} catch (KeeperException e) {
e.printStackTrace();
} catch (InterruptedException e) {
e.printStackTrace();
}
}
});
}
//1、创建节点
@Test
public void createNode() throws KeeperException, InterruptedException {
// 参数1:要创建的节点的路径; 参数2:节点数据 ; 参数3:节点权限 ;参数4:节点的类型
String path= zkClient.create("/Amy","ZooKeeperStudy".getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
System.out.println(path);
}
//2、获取子节点并监控节点的变化
@Test
public void getDataAndWatch() throws KeeperException, InterruptedException {
List<String> children= zkClient.getChildren("/",true);
for (String child:children){
System.out.println(child);
}
Thread.sleep(Long.MAX_VALUE);
}
//3、判断节点是否存在
@Test
public void exist() throws KeeperException, InterruptedException {
Stat stat=zkClient.exists("/Amy/java",false);
System.out.println(stat==null?"not exist":"exist");
}
}
4.5、监听服务器节点动态上下线案例
客户端能实时洞察到服务器上下线的变化:
服务器端向Zookeeper注册代码:
/**
* 服务器端向Zookeeper注册代码
*/
public class DistributeServer {
private static String connectString = "hadoop102:2181,hadoop103:2181,hadoop104:2181";
private static int sessionTimeout = 2000;
private ZooKeeper zkClient = null;
private String parentNode = "/servers";
// 创建到zk的客户端连接
public void getConnect() throws IOException {
zkClient = new ZooKeeper(connectString, sessionTimeout, new Watcher() {
public void process(WatchedEvent event) {
}
});
}
// 注册服务器
public void registServer(String hostname) throws Exception {
String create = zkClient.create(parentNode + "/server", hostname.getBytes(), ZooDefs.Ids.OPEN_ACL_UNSAFE, CreateMode.EPHEMERAL_SEQUENTIAL);
System.out.println(hostname + " is online " + create);
}
// 业务功能
public void doSomething(String hostname) throws Exception {
System.out.println(hostname + " is working ...");
Thread.sleep(Long.MAX_VALUE);
}
public static void main(String[] args) throws Exception {
// 1获取zk连接
DistributeServer server = new DistributeServer();
server.getConnect();
// 2 利用zk连接注册服务器信息
server.registServer(args[0]);
// 3 启动业务功能
server.doSomething(args[0]);
}
}
客户端监听:
/**
* 客户端
*/
public class DistributeClient {
private String connectString = "hadoop102:2181,hadoop103:2181,hadoop104:2181";
private static int sessionTimeout = 2000;
private ZooKeeper zkCient;
private String parentNode = "/servers";
// 创建到zk的客户端连接
private void getConnect() throws IOException {
zkCient = new ZooKeeper(connectString, sessionTimeout, new Watcher() {
public void process(WatchedEvent watchedEvent) {
// 再次启动监听
try {
getServerList();
} catch (KeeperException e) {
e.printStackTrace();
} catch (Exception e) {
e.printStackTrace();
}
}
});
}
// 获取服务器列表信息
public void getServerList() throws Exception {
// 1获取服务器子节点信息,并且对父节点进行监听
List<String> children = zkCient.getChildren(parentNode, true);
// 2存储服务器信息列表
ArrayList<String> servers = new ArrayList<String>();
// 3遍历所有节点,获取节点中的主机名称信息
for (String child : children) {
byte[] data = zkCient.getData(parentNode + "/" + child, false, null);
servers.add(new String(data));
}
// 4打印服务器列表信息
System.out.println(servers);
}
// 业务功能
public void doSomething() throws Exception {
System.out.println("client is working ...");
Thread.sleep(Long.MAX_VALUE);
}
public static void main(String[] args) throws Exception {
// 1获取zk连接
DistributeClient client = new DistributeClient();
client.getConnect();
// 2获取servers的子节点信息,从中获取服务器信息列表
client.getServerList();
// 3业务进程启动
client.doSomething();
}
}