【mysql学习篇】为什么mysql用B+Tree?

文章讨论了不同数据结构如二叉树、红黑树、B树和B+树的特性,特别是它们在存储和查询效率上的差异。B+树由于其非叶子节点存储索引和叶子节点间的指针连接,能有效减少磁盘I/O操作,适合MySQL的索引需求,尤其对于范围查询和全表扫描有优势。尽管如此,修改MySQL的文件页大小不被推荐,因为默认的16K设置是经过优化的,过大可能增加内存压力。
摘要由CSDN通过智能技术生成

1. 各种数据结构的对比

二叉树

  1. 不会平衡树节点,如果插入一组递增的数值,会导致树的高度很高,查询起来非常耗时

假设{1,2,3,4,5,6 } 一组数据需要存储,那么他的树的高度就为6
在这里插入图片描述

红黑树(二叉平衡树)

  1. 虽然实现了平衡节点,但是每个节点只能存储一个元素的结构还是会导致树高度很高,不如B树和B+树的索引文件页的方式存储
    在这里插入图片描述

B树

  1. 每个节点都会存储 data数据(每个节点存储容量就大了),这样每个文件页能存储的索引数就相对来说少了很多

B + Tree

  1. 非叶子节点存储的是冗余的索引字段,只有叶子节点才存储data数据这样每一页文件页能存储的索引就大大的提升了,对应的树的高度也得到了优化
  2. 叶子节点用指针连接,提高区间访问的效率
    在这里插入图片描述

2. 为什么mysql用B+Tree?

  1. B树和B+Tree每一个节点实际上可以理解为是一个文件页 mysql默认给一个文件页分配16k存储
  2. B树的每个节点都会存储data数据,而B+Tree的话非叶子节点是存储的索引(冗余),不存储data数据,这样每一页文件页能存储的节点就很多,树的高度就可以得到很好的控制,树的高度越高,从磁盘load节点到内存对比的次数就会越多,磁盘I/O是费时
  3. 所以B+Tree在树高度相同的情况下能够存储更多的索引数据,间接的减少了磁盘的I/O操作,B+Tree的I/O次数会更加稳定一些。
  4. 还有就是从范围查询的角度上来说B+Tree也具备绝对的优势,因为B+Tree在每个相邻的叶子节点之间都有互相指向
  5. B+Tree在全表扫描的情况下也是比较占优势的,因为B+Tree的数据都是存储在非叶子节点的,所以只需要扫描叶子节点就可以拿到全部数据了,B Tree的话就需要从头遍历整颗树

查看mysql文件页大小(16K):

SHOW GLOBAL STATUS like 'Innodb_page_size’

3. 为什么不推荐修改mysql一个文件页默认分配的大小?

  1. 每次查找数据都需要把依次索引文件页load到内存进行比较,一个系统会有很多数据库很多表,如果每个文件页的大小设置过大的话,那么就给内存带来了很大的压力,这个值是mysql多次测试得到的最优的大小,一般不推荐修改
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
### 回答1: MySQL 之所以使用 B 树来实现索引,是因为 B 树具有很好的查询性能和可扩展性。 B 树能够在 logarithmic 的时间内完成查询,这使得它在处理大量数据时仍然保持较快的速度。在 B 树中,每个节点都包含若干个键值和指向其子节点的指针。查询时,可以从根节点开始,通过比较键值来确定应该查询哪个子节点,从而快速定位所需的数据。 B 树还具有很好的可扩展性,因为它允许动态地添加和删除节点。当数据量增加时,可以通过在 B 树中插入新节点来扩展索引。同时,B 树还具有自平衡的特性,能够保证树的高度在可接受的范围内,这使得查询的速度得到保障。 因此,MySQL 使用 B 树来实现索引,是因为它具有较高的查询性能和可扩展性,能够满足大多数场景下的需求。 ### 回答2: MySQL索引使用B树的原因有以下几点: 1. 平衡二叉树:B树是一种平衡二叉树,节点的子树个数范围为[ceil(m/2),m],m为节点的最大子树个数,通常为2。通过保证树的平衡性,B树可以快速进行查找操作。 2. 数据的有序性:B树的特点是节点中的关键字有序排列,这样可以避免进行无谓的比较。在查找过程中,不需要遍历整个树,只需要通过比较当前节点的关键字和目标关键字的大小,就可以确定下一步的查找方向,从而加快搜索的速度。 3. 多级索引:B树是多级索引的基础,根节点存储的是子节点的指针,通过多级索引可以减少磁盘IO的操作。B树的高度相对较低,可以通过少量的磁盘IO就能访问到大量的数据。 4. 更新高效:B树的插入和删除操作相对高效。插入操作只需要找到插入位置,并将新节点插入到正确的位置,然后更新父节点的指针即可。删除操作类似,只需要找到要删除的节点,并更新相邻节点的指针即可。 由于B树具有平衡性、有序性、多级索引和高效的插入、删除操作,因此MySQL索引使用B树结构,并且能够提供快速的数据查找能力。同时,MySQL还结合其他优化技术如自适应哈希索引、覆盖索引等,进一步提升索引的查询性能。 ### 回答3: MySQL 索引使用 B 树结构,并且执行速度很快的原因有以下几点。 首先,B 树是一种平衡多叉树,其每个节点可以包含多个键值对,这使得 B 树能够在读取和写入数据时都能够较少的访问磁盘。在数据库中,数据通常存储在磁盘上,而磁盘的读写速度较慢,因此减少磁盘访问次数可以提高查询速度。B 树通过将数据分散存储在不同的节点上,并采用适当的分裂和合并策略,以保持树的平衡,使得查询的访问路径较短,从而可以尽可能少地访问磁盘。 其次,B 树在结构上支持按照顺序访问数据。因为 B 树的节点按照键值有序排列,加上每个节点可以包含多个键值对,这使得在范围查询时可以以更加高效的方式访问数据。例如,当根据索引范围进行查询时,只需要找到范围的起始节点,然后按照顺序遍历即可,而不需要遍历所有数据。 另外,B 树还支持数据的插入和删除操作,这对于索引的维护非常重要。当数据插入或者删除时,B 树可以通过分裂和合并节点来保持树的平衡。这样就不需要对整个树进行重新构建,从而提高索引的维护效率。 总而言之,MySQL 索引采用 B 树的数据结构,并且在查询、插入和删除操作中都能够保持较快的执行速度。B 树的平衡性、顺序性以及对插入和删除操作的高效支持,使得 B 树索引成为了数据库中广泛应用的一种索引结构。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Java学习者柯十一

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值