B树以及B+树

最新推荐文章于 2024-08-13 09:16:27 发布

李仲坚

最新推荐文章于 2024-08-13 09:16:27 发布

阅读量581

点赞数 21

文章标签： b树数据结构

本文链接：https://blog.csdn.net/qq_42029844/article/details/140820546

版权

B+树是一种自平衡的树数据结构，常用于数据库和文件系统中的索引。它是一种变体的B树，但具有一些不同的特点，使其在某些应用中更为高效。以下是B+树的关键特点及其实现的介绍：

主要特点

所有值都在叶子节点：
- B+树的所有数据值都存储在叶子节点中，内部节点只存储键值和指向子节点的指针。
叶子节点形成链表：
- 所有叶子节点通过指针形成一个双向链表，这使得范围查询非常高效。
平衡性：
- B+树总是保持平衡，所有叶子节点在树中的深度相同。
高扇出：
- 每个节点包含多个子节点指针，这使得树的高度较低，从而减少了查找时间。

关键操作

查找：
- 从根节点开始，依次比较键值并沿着子节点指针向下查找，直到找到目标值或达到叶子节点。
插入：
- 插入新值时，首先找到适当的叶子节点，然后将新值插入该节点中。
- 如果节点溢出，则进行分裂，并将中间值提升到父节点。
删除：
- 删除值时，首先找到包含该值的叶子节点，然后将值删除。
- 如果节点中的值数量低于最小值，则需要进行合并或重新分配以保持平衡。

B+树的具体实现

以下是一个简单的B+树实现示例：

class BPlusTreeNode:
    def __init__(self, is_leaf=False):
        self.keys = []
        self.children = []
        self.is_leaf = is_leaf

class BPlusTree:
    def __init__(self, t):
        self.root = BPlusTreeNode(is_leaf=True)
        self.t = t  # Minimum degree (defines the range for number of keys)

    def search(self, k, x=None):
        if x is not None:
            i = 0
            while i < len(x.keys) and k > x.keys[i]:
                i += 1
            if i < len(x.keys) and k == x.keys[i]:
                return (x, i)
            elif x.is_leaf:
                return None
            else:
                return self.search(k, x.children[i])
        else:
            return self.search(k, self.root)
    
    def insert(self, k):
        root = self.root
        if len(root.keys) == (2 * self.t) - 1:
            temp = BPlusTreeNode()
            self.root = temp
            temp.children.append(root)
            self.split_child(temp, 0)
            self.insert_non_full(temp, k)
        else:
            self.insert_non_full(root, k)
    
    def insert_non_full(self, x, k):
        i = len(x.keys) - 1
        if x.is_leaf:
            x.keys.append(None)
            while i >= 0 and k < x.keys[i]:
                x.keys[i + 1] = x.keys[i]
                i -= 1
            x.keys[i + 1] = k
        else:
            while i >= 0 and k < x.keys[i]:
                i -= 1
            i += 1
            if len(x.children[i].keys) == (2 * self.t) - 1:
                self.split_child(x, i)
                if k > x.keys[i]:
                    i += 1
            self.insert_non_full(x.children[i], k)
    
    def split_child(self, x, i):
        t = self.t
        y = x.children[i]
        z = BPlusTreeNode(is_leaf=y.is_leaf)
        x.children.insert(i + 1, z)
        x.keys.insert(i, y.keys[t - 1])
        z.keys = y.keys[t:(2 * t) - 1]
        y.keys = y.keys[0:t - 1]
        if not y.is_leaf:
            z.children = y.children[t:2 * t]
            y.children = y.children[0:t]

    def delete(self, k):
        # Delete operation is complex and requires balancing after deletion
        # The code for delete operation is omitted here for brevity
        pass
    
    def print_tree(self, x, l=0):
        print("Level", l, " ", len(x.keys), end=":")
        for i in x.keys:
            print(i, end=" ")
        print()
        l += 1
        if len(x.children) > 0:
            for i in x.children:
                self.print_tree(i, l)

关键操作解释

查找 (search)：
- 从根节点开始，依次比较键值并沿着子节点指针向下查找，直到找到目标值或达到叶子节点。
插入 (insert) 和 分裂节点 (split_child)：
- 插入新值时，首先找到适当的叶子节点，然后将新值插入该节点中。
- 如果节点溢出（键值数量超过最大值），则进行节点分裂，并将中间值提升到父节点。
删除 (delete)：
- 删除操作较为复杂，通常需要重新分配或合并节点以保持树的平衡和B+树的性质。
打印树 (print_tree)：
- 以层次结构打印树的节点和键值，便于调试和观察树的结构。

通过以上操作，B+树可以高效地支持插入、删除和查找操作，并在数据库和文件系统的索引中得到了广泛应用。

B树是一种与B+树相关的数据结构，也被广泛用于数据库和文件系统的索引中。与B+树相似，B树也是一种自平衡的多路搜索树，其主要特点包括：

节点结构：
- B树的每个节点可以包含多个键值，与B+树不同的是，B树的每个节点除了存储键值外，也存储指向子节点的指针。这意味着B树的内部节点和叶子节点都可以存储数据。
平衡性：
- B树也保持平衡，即所有叶子节点位于同一层级，从根节点到任何叶子节点的路径长度相同。
叶子节点：
- 与B+树不同的是，B树的叶子节点也可以存储数据，而不仅仅是键值。这使得B树在某些查询场景下可能比B+树更快，因为不需要额外的叶子节点查找。
应用场景：
- B树常用于文件系统和数据库中，特别是当数据集合较小或查询涉及到数据和索引时，B树的设计可以更直接地支持范围查询和部分匹配查询。

主要区别

数据存储位置：
- B树的所有节点，包括内部节点和叶子节点，都可以存储数据，而B+树的数据只存储在叶子节点中。
叶子节点结构：
- B树的叶子节点可以直接存储数据，而B+树的叶子节点只包含键和指向数据的指针（或数据本身）。
适用场景：
- B树适用于小规模数据集或需要直接从索引节点中获取数据的查询，而B+树适用于大规模数据集和需要范围查询优化的情况。

示例

以下是一个简单的B树示例：

           [10 20]
          /   |   \
     [1 5]  [12 16]  [22 30 40]
    /  |  \  |  |  \  |   |   |  # 叶子节点包含数据

在这个示例中，B树的每个节点除了存储键值外，还可以直接存储数据。这与B+树的叶子节点结构有所不同，但它们共享相似的平衡性和自平衡操作。

李仲坚

关注

21
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
B树以及B+树

B+树是一种自平衡的树数据结构，常用于数据库和文件系统中的索引。它是一种变体的B树，但具有一些不同的特点，使其在某些应用中更为高效。
复制链接

扫一扫