一. 二叉树
研究 B+ Tree 时发现,B+ Tree 的思想是逐步演化而来的。由二叉查找树 -> 平衡二叉树 -> 2-3 树 -> B 树演变而来;
1.1 二叉查找树
二叉查找树是一个很典型的递归概念:
- 节点 root 的左子树上的任意节点的 key 值都比 root 小;
- 节点 root 的右子树上的任意节点的 key 值都比 root 大;
- root 的左右子树都是二叉查找树;
二叉树的查找效率与二叉树的结构有关,如果是平衡的二叉树,查找效率可以达到 logN,但极端条件下(如只有右子树的情况),则退化成单链表。
注:二叉树的根节点,是第一个插入到二叉树的节点,后续插入删除过程不会更新根节点;
1.2 平衡二叉树 (AVL)
1.3 2-3 树
注:2-3 树是一种比较复杂的数据结构,理解 2-3 树的主要作用,是为了理解红黑树。红黑树是对于 2-3 树的编码实现,并将 2-3 转换为二叉树的形式。
2-3 树最重要的性质就是**插入过程中实现自平衡。**对于插入操作,可以分为两种情况:
- 向 2 节点插入:只需要将 2 节点变为 3 节点即可(且 3 节点内部按照两个 key 值大小也有排序);
- 向 3 节点插入:先插入到 3 节点中变为 4 节点,然后将 4 节点拆开,中间两个元素 (记作 2, 3) 抽出作为父节点,1 作为父节点的左子树,4 作为父节点的右子树;
- 如果涉及到多层 3 节点的插入,则一直分裂,直到遇到 2 节点,或者根节点为止;
- 红黑树的旋转操作,本质上就是 2-3 树插入操作的过程中,为了保证 2-3 树的性质而进行的补充操作;
4. 红黑树
红黑树原本感觉很难,但发现本质上就是一个用红色表示 2 节点的 2-3 树,形式上仍旧使用普通二叉树的形式。这样既有了二叉树的操作,又有 2-3 树的高效率查询(logN);
注:2-3 树插入时的自平衡操作,被转换为红黑树的左旋、右旋、翻色 (filpColor) 操作;