mysql-4.索引模型和B+树索引

最新推荐文章于 2023-05-20 13:38:40 发布

luzaichun

最新推荐文章于 2023-05-20 13:38:40 发布

阅读量233

点赞数 1

分类专栏：数据库文章标签： mysql

本文链接：https://blog.csdn.net/qq_40911404/article/details/104971819

版权

数据库专栏收录该内容

13 篇文章 1 订阅

订阅专栏

讲到mysql，那么索引肯定是绕不开的话题，大家平时工作中应该也经常接触。索引，简单点概括，就是为了提高数据的查询效率，就像书的目录一样

常见的索引模型：

哈希索引：是一种键-值（key-value）的数据结构索引。哈希的思路很简单，把值放在数组里，用一个哈希函数把 key 换算成一个确定的位置，然后把 value 放在数组的这个位置。
缺点:key的hash冲突问题；范围查询要遍历全部数据；如果是有序数组，查询范围查询虽然很快，但是更新数据时候就很麻烦
二叉搜索树：树形结构，每个节点的左儿子小于父节点，父节点又小于右儿子。查询时间复杂度为O(logN)。
在某些极端情况下，树可能会变成线性。为了保证查询时间复杂度为O(logN)，这个时候又会有平衡二叉树。
为了减少和磁盘的IO，后面有引入了N叉树，通过降低树的高度方式减少磁盘IO。

在这里插入图片描述

InnoDB 的索引模型

InnoDB使用的是B+树的索引模型，每一个索引在 InnoDB 里面对应一棵 B+ 树。
例：

#1.新建一张表T,给字段k加上索引
create table T(
id int PRIMARY key,
k int not null,
name varchar(32),
INDEX(k)
)ENGINE=INNODB;

#2.添加些数据
INSERT INTO `t` (`id`, `k`, `name`) VALUES ('100', '1', 'a');
INSERT INTO `t` (`id`, `k`, `name`) VALUES ('200', '2', 'b');
INSERT INTO `t` (`id`, `k`, `name`) VALUES ('300', '3', 'c');
INSERT INTO `t` (`id`, `k`, `name`) VALUES ('500', '5', 'e');
INSERT INTO `t` (`id`, `k`, `name`) VALUES ('600', '6', 'f');

在这里插入图片描述
那么这张表中就有两棵树：1.主键索引ID字段的树，2.非主键的k字段索引树
两棵树如下图：R1~R5表示的是表中第几行整行数据

主键索引的叶子节点存的是整行数据。在 InnoDB 里，主键索引也被称为聚簇索引（clustered index）。

非主键索引的叶子节点内容是主键的值。在 InnoDB 里，非主键索引也被称为二级索引（secondary index）

基于主键索引的查询和普通索引的查询区别:

如果语句是 select * from T where ID=500，即主键查询方式，则只需要搜索 ID 这棵 B+ 树；
如果语句是 select * from T where k=5，即普通索引查询方式，则需要先搜索 k 索引树，得到 ID 的值为 500，再到 ID 索引树搜索一次。这个过程称为回表。

因为基于非主键索引的查询需要多扫描一颗索引树，因此我们尽量使用主键索引查询比较好。