1. 概述
对于使用者来讲,zookeeper就像一个内存数据库,但是zookeeper的这个内存数据库真的是个数据库吗?还是就是存于内存中的一个对象呢?
根据ZooKeeper启动脚本./zkServer.sh start -server ip:port
,打开脚本可以看到服务端启动入口:org.apache.zookeeper.server.quorum.QuorumPeerMain
。
注意:服务端的数据存放结构是:org.apache.zookeeper.server.DataTree
,dataTree是放在ZKDataBasse
中的。
2. ZKDatabase的结构
这个类是用来维护zookeeper服务器状态的内存数据库,他包含会话和已提交的日志。
在从磁盘读入日志和快照数据之后,会启动起来。
这就是庐山真面目了,下面我们说说他的内部属性:
dataTree,sessionsWithTimeouts,snapLog,commitedLog
2.1 探究dataTree
数据结构:DateTree是整个zookeeper内存数据库的核心,代表了内存中一份完整的数据。
这棵树维护了2个并行的数据结构,一个是哈希表(全路径到数据节点的映射),一个是一棵由数据节点构成的树。所有的访问都是通过哈希表来映射到数据节点的。
这棵树仅仅是在序列化到磁盘的时候才会遍历。
public class DataTree {
private final ConcurrentHashMap<String, DataNode> nodes = new ConcurrentHashMap<String, DataNode>();
private final WatchManager dataWatches = new WatchManager();
private final WatchManager childWatches = new WatchManager();
2.2 DataNode
DataNode是数据库存储的最小单元,我们看看它内部都有什么构成:
-
这个类包含着在树中每个节点的数据信息
-
一个数据节点包含着它的父引用,一个数据的字节数组,一个访问控制列表,和一个子节点路径的集合
public class DataNode implements Record {
byte data[];
Long acl;
public StatPersisted stat;
private Set<String> children = null;
我来解释一下:
parent:父节点信息
data[]:数据信息
acl:访问控制信息
stat:持久化到磁盘上的统计信息
children:子节点信息