1.数据库索引为什么使用树结构存储?
a: 树结构查询效率较高,并且可以保持有序。
2.为什么索引使用B+树而未使用二叉查找树来实现?
a : 从算法逻辑上来讲,二叉查找树的查找次数和比较次数都比较少,但是考虑到显示操作的问题 磁盘IO次数,当利用索引查询时,内存将磁盘页逐一加载,磁盘页对应索引树的节点,在最坏情况下,磁盘的IO次数与二叉查找树的高度相同,为了减少磁盘的IO次数,需要将二叉查找树的树高降低,IO次数将相应降低,整个树从瘦高变得比较矮胖。
B+树是B-树的一种变体。
首先了解一下什么叫做B-树 (Balance Tree),B-树是一种多路平衡查找树,它的每一个节点最多包含K个孩子,k称为B树 的阶。K的大小取决于磁盘页的大小。
一个m阶的B-树有如下几个特征:
1.根节点至少有两个子女
2.每个中间节点都包含k-1个元素和k个孩子 其中 m/2<= k <= m
3. 每个叶子节点都位于同一层。
作为B-树的一种变种,B+树有比B-树更高的查询性能
B+树的几个特征:
1.有k个子树的中间节点包含有k个元素 每个元素不保存数据,只用来索引。所有数据保存子啊叶子节点中。
2.所有叶子节点中包含了全部元素的信息,以及指向这些元素的指针,且叶子节点依据关键字的大小自小而大的顺序连接。
3.所有中间节点元素都在同时存在于叶子节点,在叶子节点中是最大元素或者最小元素。
4.根节点最大元素也就是B+树的最大 元素。
卫星数据: 指的是索引元素所指向的数据,例如数据库中的某一行。
在B-树中 无论是中间节点还是叶子节点都带有卫星数据。
在B+树中 卫星数据存放于树的叶子节点中。中间节点仅仅存放索引,未有数据关联。
所以B+树优点在于查询效率上,中间节点不包含卫星数据,进而可以存放更多的索引元素,变得更加矮胖,IO次数更小,虽然会使比较次数增多,但由于比较发生于内存中所以对于整体的效率来书还是影响很小。
其次由于B+树的特点,每次查询都要查到叶子节点,而B-树则只要匹配到相应节点元素即可,所以B-树的查询是不稳定的,而B+树的每一次查找都是稳定的。
所有叶子节点形成有序链表,便于范围查询,效率远高于B+树
6436

被折叠的 条评论
为什么被折叠?



