MTSQL索引结构

最新推荐文章于 2023-08-14 23:30:00 发布

种向日葵的小仙女

最新推荐文章于 2023-08-14 23:30:00 发布

阅读量434

点赞数 2

分类专栏：数据库文章标签：索引结构 B B- 哈希

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qiuchaoxi/article/details/80011217

版权

数据库专栏收录该内容

26 篇文章 2 订阅

订阅专栏

先介绍几种数据结构：

AVL：平衡二叉树，Windows对进程地址空间的管理用到了平衡二叉树。

红黑树：平衡二叉树，能保证在最坏情况下，基本的动态几何操作的时间均为O（lgn）有如下几个特性：

1）每个结点要么是红的，要么是黑的。

2）根结点是黑的。

3）每个叶结点（叶结点即指树尾端NIL指针或NULL结点）是黑的。

4）如果一个结点是红的，那么它的俩个儿子都是黑的。

5）对于任一结点而言，其到叶结点树尾端NIL指针的每一条路径都包含相同数目的黑结点。

相比于BST，因为红黑树可以能确保树的最长路径不大于两倍的最短路径的长度，所以可以看出它的查找效果是有最低保证的。在最坏的情况下也可以保证O(logN)的，这是要好于二叉查找树的。因为二叉查找树最坏情况可以让查找达到O(N)。

B树：即二叉搜索树，都是小的元素放左边，大的元素放右边。比如说要查找某个元素，其时间复杂度就对应该元素的深度，如要查询9，从根节点开始，只要比较三次就找到他了，其查询效率是非常高的。

B-树：这里的 B 表示 balance( 平衡的意思),B-树是一种多路自平衡的搜索树

它类似普通的平衡二叉树，不同的一点是B-树允许每个节点有更多的子节点。下图是 B-树的简化图.

B-树有如下特点:

所有键值分布在整颗树中；

任何一个关键字出现且只出现在一个结点中；

搜索有可能在非叶子结点结束；

在关键字全集内做一次查找,性能逼近二分查找；

B+树：B+树是B-树的变体，也是一种多路搜索树, 它与B- 树的不同之处在于:

所有的数据都存放在叶子节点上，且把叶子节点通过指针连接到一起，形成了一条数据链表，以加快相邻数据的检索效率。

简化 B+树如下图

Tire树（字典树）：用在统计和排序大量字符串，如自动机。

1. B+/B-树索引：文件系统及数据库系统普遍采用B-/+Tree作为索引结构。MySQL 是基于磁盘的数据库系统,索引往往以索引文件的形式存储的磁盘上,索引查找过程中就要产生磁盘I/O消耗,相对于内存存取，I/O存取的消耗要高几个数量级,索引的结构组织要尽量减少查找过程中磁盘I/O的存取次数。为什么使用B-/+Tree，还跟磁盘存取原理有关。

局部性原理与磁盘预读

由于磁盘的存取速度与内存之间鸿沟,为了提高效率,要尽量减少磁盘I/O.磁盘往往不是严格按需读取，而是每次都会预读,磁盘读取完需要的数据,会顺序向后读一定长度的数据放入内存。而这样做的理论依据是计算机科学中著名的局部性原理：当一个数据被用到时，其附近的数据也通常会马上被使用。序运行期间所需要的数据通常比较集中。

由于磁盘顺序读取的效率很高(不需要寻道时间，只需很少的旋转时间)，因此对于具有局部性的程序来说，预读可以提高I/O效率.预读的长度一般为页(page)的整倍数。

MySQL(默认使用InnoDB引擎),将记录按照页的方式进行管理,每页大小默认为16K(这个值可以修改).linux默认页大小为4K。

为什么使用 B+树？

1. B+树更适合外部存储,由于内节点无 data 域,一个结点可以存储更多的内结点,每个节点能索引的范围更大更精确,也意味着 B+树单次磁盘IO的信息量大于B-树,I/O效率更高。

2. Mysql是一种关系型数据库，区间访问是常见的一种情况，B+树叶节点增加的链指针,加强了区间访问性，可使用在范围区间查询等，而B-树每个节点 key 和 data 在一起，则无法区间查找。

我们得出结论，由于数据存数在磁盘上，因此应该尽量减少磁盘I/O次数。恰好，B+树的叶子节点存储了关键字的数据层（我们可以称为主键），因此我们可以直接通过主键来查询数据。若是使用二叉树，二叉树索引的只是主键的位置，我还需要根据二叉树索引主键的位置，进行一次I/O操作来获取主键。

2.哈希索引：使用哈希索引的原因是，在寻找值时哈希表效率极高。但是因为hash结构，每个键只对应一个值，而且是散列的方式分布。所以它并不支持范围查找和排序等功能。

3. 全文索引：全文索引是为了使得关键词搜索功能更加的高效能。

种向日葵的小仙女

关注

2
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

种向日葵的小仙女 CSDN认证博客专家 CSDN认证企业博客

码龄8年

159: 原创

13万+: 周排名

186万+: 总排名

42万+: 访问

: 等级

5342: 积分

90: 粉丝

516: 获赞

40: 评论

694: 收藏

私信

关注

分类专栏

最新评论

wait()和sleep()的区别
loveRoselove: 让出的是CPU的执行时间分片，锁不释放不影响这个过程，如果其他线程都需要这个没有释放的锁，那最终结果就是让出执行权，大家都不执行。
虚拟地址、逻辑地址、线性地址、物理地址的区别
AntyRia: 能举个例子吗，全是千篇一律的概念
子查询和关联查询的区别
咔咔-: 亲测，两张表数据都在500W以上，使用关联查询进行排序耗时8s，将关联查询改为子查询耗时900ms
索引的分类
攻城狮杰森: 厉害喽,
类加载的五个过程：加载、验证、准备、解析、初始化
一条游向寒江的鱼: 条理清晰，学习了学习了

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。