当前对ZooKeeper的分析文章中,大都针对paxos和FastLeaderElection展开,当然,那是ZooKeeper实现一致性的关键技术,无可厚非,但本文想要另辟蹊径,简要介绍一下ZooKeeper在内存中的数据结构。由DataTree的实现,可以发现,当前系统在设计时,对于内存的考虑已经没有那么重要,可能跟当前内存越做越大有关,处处体现着以空间换时间的思想
ZooKeeper在内存中的数据结构有DataTree类表示,该类包含的元素如下图所示。
大家都知道,ZooKeeper在内存中维持了一个类似于文件系统的树形结构,这个结构由pTrie表示。此处的Trie树与传统的Trie树实现的思想类似,只是它的每一个树形节点是一个字符串,而不是传统Trie树那样的一个字符。采用字符串的方式使得Trie树的实现非常简单,这个可能跟ZooKeeper的业务需求有关,因为ZooKeeper不是专门用来再内存中存放大量节点内容的,而是通过少量的内容来实现分布式锁、配置管理等特定逻辑功能。(这也就是为什么ZooKeeper不用担心使用Trie树带来内存爆炸的问题,也没有使用单个字符的方式来最大限度的复用字符节点)
nodes是一个HashMap<String,DataNode>,存放一个Path和其相关信息的映射(其相关信息由DataNode实现)。
待续...