如果单从算法逻辑上讲,二叉搜索树的查询速度非常快,比较次数也是最少的,但是这有一个前提,就是所有的数据都必须在内存中查找
现实问题:磁盘读写速度
数据库的索引是存储在磁盘上的,如果数据量不大可以全部装载到磁盘中,如果数据量比较大,无法将所有的数据全部的索引数据一次性装载到内存的,能做是逐一加载每个磁盘页,这里的磁盘页对应着搜索树的节点,如果用二叉搜索树的话情况会非常糟糕
举例说明
从高度为4的二叉搜索树中查找值为8的节点
首先找到值为9的根节点,8比9小,所以我们要找的节点应该在根节点的左子树中,找到值为5的节点,8比5大,所以我们要找的节点应该在值为5的节点的右子树中,找到值为7的节点,8比7小,所以我们要找的节点应该在值为7的节点的右子树中,找到了8任务完成
经过了4步才搜索到了8,所以对磁盘读写了4次,最坏的情况下磁盘的读写次数等于树的高度
为了减少磁盘的读写次数,就需要尽量减小数的高度
所以可以考虑b树,b树的特点
- 树中每个节点最多包含m个孩子,m被称为树的阶,m的