MySql索引

最新推荐文章于 2024-04-30 17:49:31 发布

Mr - Wang

最新推荐文章于 2024-04-30 17:49:31 发布

阅读量75

点赞数

文章标签： mysql

本文链接：https://blog.csdn.net/qq_42712251/article/details/107324242

版权

MySql索引

B+树
索引

B+树

MySql目前主要采用的引擎是InnoDB；

在InnoDB中，表都是根据主键顺序以索引的形式存放的，这种存储方式的表称为索引组织表。又因为前面我们提到的，InnoDB使用了B+树索引模型，所以数据都是存储在B+树中的。

特点

一个m阶的B树具有如下几个特征：

B+树包含2种类型的结点：内部结点（也称索引结点）和叶子结点。根结点本身即可以是内部结点，也可以是叶子结点。根结点的关键字个数最少可以只有1个。
B+树与B树最大的不同是内部结点不保存数据，只用于索引，所有数据（或者说记录）都保存在叶子结点中。
m阶B+树表示了内部结点最多有m-1个关键字（或者说内部结点最多有m个子树），阶数m同时限制了叶子结点最多存储m-1个记录。
内部结点中的key都按照从小到大的顺序排列，对于内部结点中的一个key，左树中的所有key都小于它，右子树中的key都大于等于它。叶子结点中的记录也按照key的大小排列。
每个叶子结点都存有相邻叶子结点的指针，叶子结点本身依关键字的大小自小而大顺序链接。

注：B+树是在B树的基础上，所以B树有的，B+树也需要有；

B+树的优势：

单一节点存储更多的元素，使得查询的IO次数更少。
所有查询都要查找到叶子节点，查询性能稳定。
所有叶子节点形成有序链表，便于范围查询。

结构

在这里插入图片描述
这幅图就是B+树的结构图；用这幅图我们来解释B+树的特点；

首先是M阶的问题，根据一个节点下多少个叶子来确定多少阶，比如中间的 2 5 8 底下有三个叶子，那么当前的是3阶B+树
数据存储的位置是在叶子下面，根节点和中间层都是存储索引数据，最底层的叶子之间，是有指针连接着的
每一个父节点的元素都会出现在子节点中，是子节点的最大（或最小）元素，这样的好处就是可以根据数据范围，更快的查找到元素位置，比如要查询2，那么父节点都是元素是子元素中最大的，那么就知道根据8的指正查找到 2 5 8 ，之后根据2 查找到最下面的元素存储位置了，还是很快的；
指针连接的好处，可以看出叶子层的数据都是连接在一起的，那么这样的好处，是在做范围查找的时候，我们查询的最开始的位置，就可以往下找了，比如 2 到 9 的所有地址，那么根据之前的找法找到2 以后，就可以根据指针找到 9，查询的成本比较低
B+树的结构推荐 B+树的结构
B+树的删除推荐博客B+树的操作

索引

结构

表中R1~R5的(ID,k)值分别为(100,1)、(200,2)、(300,3)、(500,5)和(600,6)，两棵树的示例示意图如下
在这里插入图片描述

从图中不难看出，根据叶子节点的内容，索引类型分为主键索引和非主键索引。

主键索引的叶子节点存的是整行数据。在InnoDB里，主键索引也被称为聚簇索引（clustered index）。

非主键索引的叶子节点内容是主键的值。在InnoDB里，非主键索引也被称为二级索引（secondary index）。

基于主键索引和普通索引的查询有什么区别？

如果语句是select * from T where ID=500，即主键查询方式，则只需要搜索ID这棵B+树；

如果语句是select * from T where k=5，即普通索引查询方式，则需要先搜索k索引树，得到ID的值为500，再到ID索引树搜索一次。这个过程称为回表。
也就是说，基于非主键索引的查询需要多扫描一棵索引树。因此，我们在应用中应该尽量使用主键查询。

索引维护

B+树为了维护索引有序性，在插入新值的时候需要做必要的维护。以上面这个图为例，如果插入新的行ID值为700，则只需要在R5的记录后面插入一个新记录。如果新插入的ID值为400，就相对麻烦了，需要逻辑上挪动后面的数据，空出位置。

而更糟的情况是，如果R5所在的数据页已经满了，根据B+树的算法，这时候需要申请一个新的数据页，然后挪动部分数据过去。这个过程称为页分裂。在这种情况下，性能自然会受影响。

除了性能外，页分裂操作还影响数据页的利用率。原本放在一个页的数据，现在分到两个页中，整体空间利用率降低大约50%。

当然有分裂就有合并。当相邻两个页由于删除了数据，利用率很低之后，会将数据页做合并。合并的过程，可以认为是分裂过程的逆过程。

在实际开发中，一张表的数据有可能都是很大的，所以为了方便索引的加入可以方便，我们一般采用了主键id自增长，这种id的自增是有序的，所以一般都是往后插入的，这样做就可以减少性能的消耗

索引种类

注意：索引是在存储引擎中实现的，也就是说不同的存储引擎，会使用不同的索引

MyISAM和InnoDB存储引擎：只支持BTREE索引，也就是说默认使用BTREE，不能够更换MEMORY/HEAP存储引擎：支持HASH和BTREE索引

1、索引我们分为四类来讲单列索引(普通索引，唯一索引，主键索引)、组合索引、全文索引、空间索引、

1.1、单列索引：一个索引只包含单个列，但一个表中可以有多个单列索引。这里不要搞混淆了。

1.1.1、普通索引：MySQL中基本索引类型，没有什么限制，允许在定义索引的列中插入重复值和空值，纯粹为了查询数据更快一点。

1.1.2、唯一索引：索引列中的值必须是唯一的，但是允许为空值，

1.1.3、主键索引：是一种特殊的唯一索引，不允许有空值。

1.2、组合索引

在表中的多个字段组合上创建的索引，只有在查询条件中使用了这些字段的左边字段时，索引才会被使用，使用组合索引时遵循最左前缀集合。这个如果还不明白，等后面举例讲解时在细说

1.3、全文索引

全文索引，只有在MyISAM引擎上才能使用，只能在CHAR,VARCHAR,TEXT类型字段上使用全文索引，介绍了要求，说说什么是全文索引，就是在一堆文字中，通过其中的某个关键字等，就能找到该字段所属的记录行，比如有"你是个靓仔，靓女 …" 通过靓仔，可能就可以找到该条记录。这里说的是可能，因为全文索引的使用涉及了很多细节，我们只需要知道这个大概意思，如果感兴趣进一步深入使用它，那么看下面测试该索引时，会给出一个博文，供大家参考。

1.4、空间索引

空间索引是对空间数据类型的字段建立的索引，MySQL中的空间数据类型有四种，GEOMETRY、POINT、LINESTRING、POLYGON。在创建空间索引时，使用SPATIAL关键字。要求，引擎为MyISAM，创建空间索引的列，必须将其声明为NOT NULL。具体细节看下面

Mr - Wang

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MySql索引

MySql索引B+树特点一个m阶的B树具有如下几个特征：B+树的优势：结构索引结构索引维护索引种类B+树MySql目前主要采用的引擎是InnoDB；在InnoDB中，表都是根据主键顺序以索引的形式存放的，这种存储方式的表称为索引组织表。又因为前面我们提到的，InnoDB使用了B+树索引模型，所以数据都是存储在B+树中的。特点一个m阶的B树具有如下几个特征：B+树包含2种类型的结点：内部结点（也称索引结点）和叶子结点。根结点本身即可以是内部结点，也可以是叶子结点。根结点的关键字个数最少可以只有
复制链接

扫一扫