数据库-索引

最新推荐文章于 2024-09-27 11:30:45 发布

载着梦想的猪

最新推荐文章于 2024-09-27 11:30:45 发布

阅读量965

点赞数 26

文章标签：数据库 mysql 后端

本文链接：https://blog.csdn.net/m0_64882384/article/details/136635649

版权

随记-数据库索引

前言

在学习数据库三级的过程中，对索引的内容进行了简单的概括和介绍，从多方面进行解析。

一、索引概述

索引（index）是帮助MySQL高效获取数据的数据结构（有序）。在数据之外，数据库系统还维护者满足特定查找算法的数据结构。这些数据结构以某种方式引用（指向）数据，这样就可以在这些数据结构上实现高级查找算法，这种数据结构就是索引。

索引（数据结构）：红黑树、二叉树、B-Tree、B+Tree

索引概述：

例如语句（select * from user where age = 45）

id	name	age
1	Zhangsan	55
2	lisi	22
3	wangwu	11
4	lierma	42
5	zhangfei	56
6	libai	45
7	huangzhong	89

在无索引的条件下，会进行全表的扫描，数据会一行行的扫描性能低

id	name	age
1	Zhangsan	36
2	lisi	22
3	wangwu	33
4	lierma	48
5	zhangfei	53
6	libai	29
7	huangzhong	45
8	Machao	17
9	Anqila	23
10	wuzetian	20

有索引：

如果像存在这样的二叉树，可以大大减少检索的效率

二、索引的优缺点：

优势	劣势
提高数据检索效率，降低数据库的IO成本	索引列需要占用空间
通过索引列对数据进行排列，降低数据排列成本，降低CPU的消耗	索引大大的提高了查询的效率，同时也降低更新表的速度，如对表进行INSERT、UPDATE、DELETE时，效率降低

三、索引结构的实现

MySQL的索引是在存储引擎层实现的，不同的存储引擎有不同的结构

索引结构	描述
R+Tree索引	最常见的索引类型，大部分的引擎都支持B+树索引
Hash索引	底层数据结构是使用哈希表实现的，只有精确匹配索引列的查询才有效，不支持范围查询
R-tree（空间索引）	空间索引是MyISAM引擎的一个特殊索引类型，主要用于地理空间数据类型，通常使用较少
Full-text（全文索引）	通过建立倒排索引（了解过es的都知道），快速匹配文档的方式，类似于Lucene,Solr,ES

索引结构：

索引	InnoDB	MyISAM	Memory
B+tree索引	支持	支持	支持
Hash索引	不支持	不支持	支持
R-tree索引	不支持	支持	不支持
Full-text索引	5.6版本后支持	支持	不支持

平常我们说的索引，没有特别的指明，都是指B+树组织结构的索引

四、索引结构——二叉树

二叉树索引相对于无索引的全表扫描显然能够大大提高查询的效率，但是也存在缺点：顺序插入时，会形成一个链表，查询性能大大降低。大数据量情况下，层级较深检索速度慢。
为了解决二叉树的顺序加入问题产生了红黑二叉树，虽说解决了顺序插入形成链表的问题，但是还是存在：大数据量的情况下，层级较深，检索速度慢。
B-Tree（多路平衡查找树）的出现解决了二叉树的顺序平衡问题，一颗最大度数（max-degree）为5（5阶）的b-tree为例（每个节点最多存储4个key,5个指针）

如图：20，30,62，89为key,存在五个指针指向第二层的五个节点

注意：树的度数是指一个节点子节点的个数

五、索引结构——B+Tree

在B树之后人们不断的完善索引结构，产生了B+Tree

最大度数（max-degree）为4（4阶）的B+tree

MySQL索引数据结构对经典的B+Tree进行了优化，增加了一个指针指向相邻叶子节点的链表指针，形成了带有顺序指针的B+Tree,提高区间访问的能力

经典

MySQL优化

注意：B+Tree与B-Tree的区别

B+Tree所有数据都只会出现在叶子节点
叶子节点形成一个单项的列表

六、索引结构——Hash索引

Hash索引采用一定的hash算法，将键值换算成新的hash值映射到对应的槽位上，然后存储在hash表中，如果两个（或者多个）键值，映射到一个相同的槽位上，就会产生hash冲突（也叫hash碰撞）,可以通过链表来解决

特点：

Hash索引只能用于对等比较（=，in），不支持范围查询（between,>,<....）
无法利用索引完成排序操作
查询效率高，通常只需要一次检索即可，效率通常高于B+Tree

存储索引支持

在MySQL中，支持hash索引的是Memory引擎，而InnoDB具有自适应的hash功能，hash索引是存储引擎根据B+Tree索引在指定条件下自动构建的。

为什么InooDB存储引擎选择使用B+tree索引结构？

相对于二叉树，层级更少，搜索效率更高
B-tree,无论是叶子节点还是非叶子节点，都会保存数据，这样导致一页中存储的键值减少，指针跟着减少，要同样保存大量数据，只能增加树的高度，导致性能降低；
与Hash索引相比，B+Tree支持范围匹配及排序操作

七、索引的分类

分类	含义	特点	关键字
主键索引	针对于表中主键创建的索引	默认自动创建，只有一个	PRIMARY
唯一索引	避免同一个表中某数据列中的值重复	可以有多个	UNIQUE
常规索引	快速定位特定数据	可以有多个
全文索引	全文索引查找的是文本中的关键词，而不是比较索引中的值	可以有多个	FULLTEXT

在InooDB存储引擎中，根据索引的存储形式，可以分为

分类	含义	特点
聚集引擎（Clustered Index）	将数据存储与索引放到一块，索引结构的叶子节点保存了行数据	必需有，且只有一个
二级索引（Secondary Index）	将数据与索引分开存储，索引结构的叶子节点关联的是对应的主键	可以存在多个