Zookeeper的会话状态变迁图:
Connection Loss:
CONNECTION_LOSS意味着客户端和服务器端的连接断开,比如,客户端创建一个Zookeeper实例,开始客户端和服务端的会话,然后进行一系列的操作。如果客户端挂了,网络出现异常或者服务器端挂了,都会导致
客户端和服务器端的连接断开。连接断开时,如果客户端进程正常工作,它将收到一个Disconnected事件,收到此事件,客户端不能假设是服务器端挂了还是网络出现问题,同样,服务器如果仍然正常工作,也不能假设是客户端挂了还是出现了网络问题。
在Connection Loss的情况下,客户端不能假设它之前发出的请求是否已经成功执行,例如客户端发起一个创建一个znode的操作,这个请求的处理可能存在如下几种情况
1. 请求发送到服务器端,服务端执行完,返回的过程中,连接断开
2. 请求尚未发送到服务器端,因此请求压根没有执行
3. 请求发送到服务器端,请求在执行过程中,服务器端挂了
第三种情况是一种极限的情况,对于一致性要求很高的场景,这个请求已经执行的部分操作应该全部失败,服务器端的状态应该是请求未执行前的状态,Zookeeper的读写操作都是原子操作,因此可以保证不会部分读取和部分写入的情况,这就保证了数据一致性。
客户端与服务器断开链接后,客户端不能确定是网络链接问题还是Zookeeper服务器挂了,因此,客户端在受到COLLECTION_LOSS事件后,
1.客户端不需要重新创建一个Zookeeper会话,客户端在Zookeeper Client Library的帮助下会持续处于CONNECTING状态,不会出现会话超时的情况(虽然会话超时时间在客户端创建Zookeeper时指定,但是Zookeeper Client Libarary不会检测会话超时)
2.客户端需要检测上次上次操作的执行情况,比如通过检查znode是否存在以判断znode是否创建成功,检查znode的数据以判断znode是否更新成功
3.在1中提到,在服务器不可用的情况,客户端在Zookeeper Client Library的帮助下会持续处于CONNECTING状态,当Zookeeper服务器恢复可用的情况下,Zookeeper尝试于Zookeeper服务器恢复链接,加入在session超时之前,恢复链接,那么对于客户端来说,会话恢复,包括已经注册的watcher,客户端会受到一个SyncConnection事件;如果超时,那么客户端会收到一个Session Expired事件。