根级别上的数据无效第1行位置1_数据库存储引擎之BTree介绍

本文深入探讨了B+Tree这种数据结构,分析了其在数据库存储引擎中的应用,包括查询、插入、删除操作的详细流程,并解释了为何B+Tree能成为数据库存储的优选方案。
摘要由CSDN通过智能技术生成

和很多系统一样,在开始实现存储引擎之前,我们需要给它找一个合适的数据结构。数据库存储引擎本质上是一个支持快速查找的系统,因此数据库存储引擎需要一个支持这样功能的数据结构。

常见数据结构

常见的查找数据结构包括HASH表和二叉树(红黑树)。

Hash表介绍

Hash表是普通数组的一个扩展,它支持O(1)的操作,包括查询,插入,以及删除。但是Hash支持O (1)时,是一个比较理想的状态,要求很好的Hash函数以及比较多的冗余内存。这部分咱们暂时不展开。

二叉树介绍

二叉树是另一种比较经典的查找数据结构,其特点如下:

  1. 只有一个根结点
  2. 任何一个子节点最多允许两个子节点
  3. 左子节点的值小于父节点的值,右子节点的值大于父节点的值

一个典型的二叉树如图所示:

e0832b2be72668fc09c710874a536ee0.png

虽然Hash表或者二叉树是比较常见的查找数据结构,但是大部分数据库存储引擎并不使用它们作为主要的数据结构(也有例外的),而是使用B-Tree以及B-Tree的变种B+Tree。

提问:有哪些数据库存储引擎是使用Hash表或者二叉树作为主要的数据结构,为什么它们使用这些数据结构?

B-Tree树

B-Tree和二叉树类似,有如下特性:

  1. 只有一个根节点
  2. 一个节点允许最多有N个值,N>2,有N+1个字节点
  3. 节点中值按照从小到大的顺序排列
  4. 第m个子节点中的所有值小于第m个值,第N+1个子节点的所有值大于第N个值
  5. 叶子节点没有子节点,所有叶子节点到根节点高度一样
  6. 一般除了根节点,节点值的个数大于等于N/2

下图为一个N=4的B-Tree:

4bb51f6495256fb4983a3b89fe2b1159.png

B-Tree优势

大多数数据库存储引擎使用B-Tree的原因有两个:

  1. 数据库存储最终需要从文件系统中读取这些节点的数据,而从文件中读取节点操作是比较耗时,因此需要一次尽量多读取一些数据,B-Tree支持N个值,正好可以用来减少文件读取的次数。例如:某个B-Tree的N为128(2^7),从2^14中读取一个数据,平均需要读取2次文件(第一次读取根节点,第二次读取叶子节点);而,如果使用二叉树,则平均需要读取14次文件(第一次读取根节点,最后一次读取叶子节点)。
  2. 硬盘有一个特性,就是硬盘读写数据时,是一个数据块一个数据块的读写,不是内存中那样,一
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值