ＭySQL 的Ｂ+树存储原理

最新推荐文章于 2024-04-18 21:37:34 发布

月华路

最新推荐文章于 2024-04-18 21:37:34 发布

阅读量2.6k

点赞数 1

分类专栏：数据库文章标签： b树数据库架构

本文链接：https://blog.csdn.net/gyh19870723/article/details/121455270

版权

数据库专栏收录该内容

2 篇文章 0 订阅

订阅专栏

　　数据库存储的数据量非常大，一般存储在磁盘上。为了加快对数据的查询，需要通过对数据进行索引。索引是查询数据时的路标，通过将索引和数据进行分离，将索引放入在内存中，可以进一步提升查询速度。

　　应该使用什么样的数据结构来构建索引呢？在计算机中，最基本的数据结构是数组和链表。数组可以通过索引在O(1)的时间复杂度定位到查询的数据，通过二分查找算法，查询一个普通的数据时间复杂度为Ｏ(logn)，但数组的插入性能比较差，也很难申请到大容量的连续存储空间。链表插入性能好，不需要申请连续的存储空间，但查询性能差。为了支持链表的快速查询，通过将链表中的某些节点提取出来作为索引节点，通过父子节点的关系进行连接，于是设计出了树这种数据结构，二叉查找树就是支持二分查找算法的链表结构。为了实现数据的快速查询，设计出了二叉查找树、平稳二叉查询树、红黑树等数据结构。

　　树有很好的查询性能，查询一个节点需要的时间与树的高度相关，但如果索引的数据量太大，内存中无法存储，就必须存储在磁盘中。如果树的高度太高，就要进行多次磁盘查询操作，如何降低树的高度呢？ B+ 树是将树形索引的所有节点都存在磁盘上的高效检索方案，索引技术从此摆脱了内存空间的限制。

　　磁盘是块存储结构，操作系统对磁盘数据的访问是以块为单位的。B+树的一个关键设计，就是让树的一个节点的大小等于一个块的大小。节点内存储的元素，不是一个元素，而是一个可以装m个元素的有序数组。B+树的另外一个设计，是非叶子节点只有索引数据和树形结构的指针，叶子节点存储具体的数据。这样非叶子节点就能存储更多的索引数据，一个3~4层的B+树就能索引几十Ｔ的数据了。B+树还将同层的节点串链起来形成双向链表，这样就具有了范围查询和灵活调整的能力。Ｂ+树每个节点内的数据通过二分查询算法进行查询。