B树和B+树的区别
- 我们首先可以了解一下 二叉树 AVL树B+树的概念
- B树和B+树的应用场景
- 为什么要用B树或者B+树来做索引结构
B树是一种多路平衡查找树满足平衡二叉树的规则(左右两个子树的高度差的绝对值不能超过1会采用左旋和右旋的方式来实现平衡) B树 可以有多个子树,子树的数量取决于关键字的数量 。 子路数量 = 关键字数+1 因此从这个特征来看存储同样数据量的情况下,平衡二叉树的高度要大于B+树
B+树在B数的基础上做了增强最大的区别有两个
- B+树的子路数量等于关键字数量,B树每个节点都会存储数据,B+树所有数据存储在叶子节点上,并且叶子节点的数据通过双向链表进行关联的.
- B树和B+树一般都是应用在文件系统中或者数据库系统中,用来减少磁盘IO带来的性能损耗.在InnoDB中对存储在磁盘块上的数据,建立一个索引,然后把索引数据以及索引列对应的磁盘地址以B+树的方式来存储,B+树的分路比较多,所以只需要较少次数的磁盘IO就能找到对应的数据
为什么要用B树或者B+树来做索引结构呢
AVL树的高度要比B数的高度要高,而高度就意味着磁盘IO的数量.所以为了减少磁盘IO次数,文件系统或者数据库才会采用B树或者B+树
完整回答
B树和B+树都是多路平衡树,能够在一个比较矮的层高中去存储大量的数据
- B树中,每个节点都包含索引及数据,所以数的层高相对来说会高一点.
- 同时在进行数据查找的时候,由于数据是存储在每个节点的,所以极端情况下要遍历整个树才能找到数据,所以查询时间的稳定性较差.
- B树的所有叶子节点都在同一层,意味着从根节点到每个叶子节点的距离相等,这样可以保证无论访问哪个叶子节点,时间复杂度都是O(log n).
对于B+树来说
- 是对B数基础上进行了优化,B+树的非叶子节点只存储索引,所有数据记录保存到叶子节点. 简单的说非叶子节点存储索引,只有叶子节点才存储数据,这样可以更好的缩小树的层高,提高查找效率.
- B+树所有叶子节点通过以个双向链表进行连接,是的范围查找的效率更高.