B树简单理解

最新推荐文章于 2024-08-23 14:33:22 发布

Variab

最新推荐文章于 2024-08-23 14:33:22 发布

阅读量179

点赞数

 
 平衡二叉排序树便于动态查找，因此用平衡二叉排序树来组织索引表是一种可行的选择。当用于大型数据库时，所有数据及索引都存储在外存，因此，涉及到内、外存之间频繁的数据交换，这种交换速度的快慢成为制约动态查找的瓶颈。若以二叉树的结点作为内、外存之间数据交换单位，则查找给定关键字时对磁盘平均进行㏒㏒次访问是不能容忍的（树的深度过大而造成磁盘I/O读写过于频繁，进而导致查询效率低下）。 

 磁盘读取数据是以盘块(block)为基本单位的。位于同一盘块中的所有数据都能被一次性全部读取出来。而磁盘IO代价主要花费在查找时间Ts上。因此我们应该尽量将相关信息存放在同一盘块，同一磁道中。或者至少放在同一柱面或相邻柱面上，以求在读/写信息时尽量减少磁头来回移动的次数，避免过多的查找时间Ts。
 所以，在大规模数据存储方面，大量数据存储在外存磁盘中，而在外存磁盘中读取/写入块(block)中某数据时，首先需要定位到磁盘中的某块，如何有效地查找磁盘中的数据，需要一种合理高效的外存数据结构，就是下面所要重点阐述的B-tree结构，以及相关的变种结构：B+-tree结构和B*-tree结构。

 
 因此，必须选择一种能尽可能降低磁盘I/OI/O次数的索引组织方式。树结点的大小尽可能地接近页的大小。 

 
      B树主要用于文件系统中，在B树中，每个节点的大小为一个磁盘的页，节点中锁包含的关键字及其子节点的数目取决于页的大小。一个度为m的B树，称为m阶B树，定义如下： 

 
      （1）一个m阶B树，或者是空树，或者满足一下性质的m叉树； 

 
      （2）根节点或者是叶子，或者至少有两颗子树，至多是m棵子树； 

 
      （3）除根节点外，所有非终端节点至少是「m/2 （向上取整）棵子树，至多是m棵子树； 

 
      （4）所有叶子节点都在树的同一层上。 

 
      （5） 

 
      下图为B树的一个例子： 

 
 1，B树的数据结构，根据以上的信息，定义B树的数据结构如下： 

 
 //节点数据结构的定义
 typedef struct BTNode
 {
     int keynum;             //节点信息的数量，不包含key[0]节点
     struct BTNode *parent;  //父节点
     int key[M+1];           //节点信息数组，第一个节点没用。
     struct BTNode *ptr[M+1];//子节点信息        
 }BTNode;
  

 
 2，B树的查找 

 
      查找的基本思想是： 

 
      （1）从树的根节点T开始，在节点中利用遍历或折半查找给定的值，如果找到，则返回节点指针和在节点中的位置；如果没有，则到（2） 

 
      （2）与节点中的Key进行比较，找到给定值左右Key中间的指针，去其子树中查找 

 
      （3）重复执行1,2两步，直到找到。如果直到叶子节点，仍未找到，则返回0，并返回最后搜索的叶子节点。（此节点是给定值需要插入的位置） 

 
 3，B树的插入 

 
      插入新节点的基本思想如下： 

 
      （1）在B树查找关键字，如果找到，则不插入；否则，执行（2） 

 
      （2）将给定值插入到叶子节点中，如果： 

 
           a，叶子的节点数 

 
           b，叶子的节点数=m-1：插入节点，并将节点分裂。分裂的方式是将该节点拆分成两个节点，然后，将中间节点插入到父节点当中，拆分后的两个节点，分别作为插入到父节点的中间节点的左右子。如果中间节点插入到父节点后，仍然需要分裂，则继续分裂，直到根节点。如果仍然需要分裂，则新建一个根节点，将分裂后的两个节点分别作为新根节点的两个子节点。