一、二叉搜索树(BST)
特点:
- 所有非叶子结点至多拥有两个儿子(Left和Right);
- 所有结点存储一个关键字;
- 非叶子结点的左指针指向小于其关键字的子树,右指针指向大于其关键字的子树;
- 它的左子树上的节点的值,都小于根节点的值;
- 它的右子树上的节点的值,都大于根节点的值;
- 至多只有两个儿子节点;
优点:
- 查找方便:
- 当前节点值 == 查找的值,查找结束,返回;
- 当前节点值大于查找的值,则进入左子树;
- 当前节点值小于查找的值,则进入右子树;
- 插入节点、删除节点同查找过程
当树的左右子树高度接近时,查找的时间效率接近 O(n) = logN,基于没有空间开销 O(1)
但是,在极端情况下,B树会退化成一棵线性树:
二、平衡二叉树(AVL)
AVL树的性质:
- 完全满足一颗二叉搜索树(BTS)所有特性
- 左右子树高度差小于等于1
由于严苛的平衡要求,当插入或删除节点时,可能会不满足左右子树高度差,因此需要递归调整,可能引起整棵树的递归 + 旋转操作。
三、红黑树(R-B Tree)
红黑树满足 BST 的特性,它不需要像 AVL 那样,要完全的平衡(左右子树高度差不超过1)。
下图中,列出了满足红黑树的 5 条性质,其中,第5点,是针对 AVL 完全平衡的一个宽松条件。
四、多叉搜索树 B 树( B-Tree )
B树是 BST 树的一个优化,BST 树只能有最多两棵子树,因此当节点很多时,树的高度就会很高。
概念:
- M:代表叉数,M = 2 即 二叉,M = 3 即 三叉;
- K:关键字(可以理解为节点的值);
- P:指针(指向其它节点的指针);
B树 查找:
- B-树的搜索,从根结点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结束;
- 否则进入查询关键字所属范围的儿子结点;
- 重复1 / 2,直到所对应的儿子指针为空,或已经是叶子结点;
五、B+ 树
特性:
- 所有关键字都出现在叶子结点的链表中(稠密索引),且链表中的关键字恰好是有序的;
- 不可能在非叶子结点命中;
- 非叶子结点相当于是叶子结点的索引(稀疏索引),叶子结点相当于是存储(关键字)数据的数据层;
- 更适合文件索引系统;
六、B* 树
B* 树是基于 B+ 树再次升级,特点是:在B+树的非根和非叶子结点再增加指向兄弟的指针。
七、总结
- 二叉搜索树:二叉树,每个结点只存储一个关键字,等于则命中,小于走左结点,大于走右结点;
- B(B-)树:多路搜索树,每个结点存储M/2到M个关键字,非叶子结点存储指向关键字范围的子结点;所有关键字在整颗树中出现,且只出现一次,非叶子结点可以命中;
- B+树:在B-树基础上,为叶子结点增加链表指针,所有关键字都在叶子结点中出现,非叶子结点作为叶子结点的索引;B+树总是到叶子结点才命中;
- B*树:在B+树基础上,为非叶子结点也增加链表指针,将结点的最低利用率从1/2提高到2/3;