MySQL 索引详解

索引的含义和特点

索引是创建在表上的,是对数据库表中一列或多列的值进行排序的一种数据结构,可以提高查询速度。索引类似于书籍目录,通过翻找目录,提取标题,可以快速定位到对应的章节

如上图,假如要执行 select * from book where title = '第一章',只要在索引页找到对应标题即可找到对应章节,否则就只能把整本书翻一遍来寻找

索引有其明显的优势,也有不可避免的缺点:

  • 创建和维护索引同样需要耗费时间,并随着数据量的增加而增加
  • 索引也会占用一定的物理空间
  • 增加、删除和修改数据时,要动态地维护索引

索引的分类和操作

1. 普通索引

所谓普通索引,就是在创建索引时,不附加任何限制条件(唯一、非空等限制),可以创建在任何数据类型的字段上

创建表时直接创建索引

CREATE TABLE tablename(  
	propname1 type1 [CONSTRAINT1],
    propname2 type2 [CONSTRAINT2],
    ......
	INDEX|KEY [indexName] (propname1 [(length) [ASC|DESC]])  
);  

在已存在的表上通过 CREATE 语句创建索引

CREATE INDEX indexName ON tablename (propname [(length) [ASC|DESC]])

通过 ALTER TABLE 语句创建

ALTER table tablename ADD INDEX|KEY indexName(propname [(length) [ASC|DESC]])
2. 唯一索引

所谓唯一索引,就是在创建索引时,限制索引的值必须唯一,主键就是一种特殊的唯一索引

创建表时直接创建索引

CREATE TABLE tablename(  
	propname1 type1 [CONSTRAINT1],
    propname2 type2 [CONSTRAINT2],
    ......
	UNIQUE INDEX|KEY [indexName] (propname1 [(length) [ASC|DESC]])  
);  

在已存在的表上通过 CREATE 语句创建索引

CREATE UNIQUE INDEX indexName ON tablename (propname [(length) [ASC|DESC]])

通过 ALTER TABLE 语句创建

ALTER table tablename ADD UNIQUE INDEX|KEY indexName(propname [(length) [ASC|DESC]])
3. 全文索引

全文索引主要关联在 CHAR、VARCHAR 和 TEXT 字段上,以便能更加快速地查询数据量较大的字符串类型字段

创建表时直接创建索引

CREATE TABLE tablename(  
	propname1 type1 [CONSTRAINT1],
    propname2 type2 [CONSTRAINT2],
    ......
	FULLTEXT INDEX|KEY [indexName] (propname1 [(length) [ASC|DESC]])  
);  

在已存在的表上通过 CREATE 语句创建索引

CREATE FULLTEXT INDEX indexName ON tablename (propname [(length) [ASC|DESC]])

通过 ALTER TABLE 语句创建

ALTER table tablename ADD FULLTEXT INDEX|KEY indexName(propname [(length) [ASC|DESC]])
4. 多列索引

所谓多列索引(联合索引),是指在创建索引时关联多个字段。虽然可以通过所关联的字段进行查询,但是只有查询条件中使用了所关联字段中的第一个字段,多列索引才会被使用

创建表时直接创建索引

CREATE TABLE tablename(  
	propname1 type1 [CONSTRAINT1],
    propname2 type2 [CONSTRAINT2],
    ......
	INDEX|KEY [indexName] (propname1 [(length) [ASC|DESC]],
                           propname2 [(length) [ASC|DESC]],
                           ......);
);  

在已存在的表上通过 CREATE 语句创建索引

CREATE INDEX indexName ON tablename (propname1 [(length) [ASC|DESC]],
                                     propname2 [(length) [ASC|DESC]],
                                     ......);

通过 ALTER TABLE 语句创建

ALTER table tablename ADD INDEX|KEY indexName(propname1 [(length) [ASC|DESC]],
											  propname2 [(length) [ASC|DESC]],
											  ......);
5. 删除索引
DROP INDEX indexName ON tablename;

索引的数据结构

MySQL 索引相关的数据结构有两种,一种是 B+Tree,一种是 Hash,大多数情况下都使用 B+Tree 索引,有关 B+Tree 可参考:https://blog.csdn.net/CSDN_handsome/article/details/109140853

之前我们说过,索引类似书籍目录,那么我们翻找目录也是一个查询行为,因为要选用合适的数据结构存储索引,提高查询效率

最直观的就是使用 Hash,使用方法就和书籍目录一样,对索引的 key 进行一次 Hash 计算就可以定位出数据存储的位置,但仅支持=IN,不支持范围查询,因为无序所以不支持范围查询,同时数据库大数据存储时容易产生 Hash 冲突

说到提高查找效率,自然会想到平衡二叉树,可参考:https://blog.csdn.net/CSDN_handsome/article/details/108870149

平衡二叉树的查询速度的确很快,但维护一棵平衡二叉树的代价是非常大的,通常来说,插入、更新和删除操作后,需要一次或多次左旋和右旋来维持树的平衡性

同时随着数据增多,平衡二叉树的高度会越来越高,大概 1000 条数据就有 9-10 层,那也就是说可能找一个数据需要 9-10 次 IO

为了解决平衡二叉树高度过高导致的 IO 问题,提出了 BTree 和 B+Tree 数据结构,两者都能降低树的高度,但同样的高度下,B+Tree 可以存储更多的索引,并且叶子结点间双向循环链表提高区间访问的性能,方便范围查找数据

使用 B+Tree 作为索引的结构如下:

我们发现,非叶子结点只存储冗余索引,用于检索数据,数据都存放在叶子节点,并且所有叶子节点都有指针相连,指向下一个叶子结点,假如要执行 select * from test_db where id = 29,只需要 3 次 IO 即可,并且根据 id 的每一次查询所需 IO 次数都是一样的,因为子树高度都一样

正因为 B+Tree 的结构特性,所以一般推荐使用整型的自增主键。如果使用非整形主键,如 UUID,索引建立时比较大小需要逐个字符转换为 ASCII 码进行比较,同时非整形主键占用空间更大,也就意味着一个索引页能够存放的索引数量不如整形主键。而且非整形主键下,每次插入主键的值近似于随机,因此新纪录都会插到现有索引页的中间某个位置,MySQL 就不得不为了将新记录插到合适位置而移动数据,增加磁盘开销。而使用整形自增主键,只需要往叶子结点后面放即可,大大减少索引页的分裂和移动数据产生的磁盘开销

上面的图是以主键索引构建 B+Tree,像这种叶子节点包含索引和数据的称为聚簇索引。每个表只能有一个聚簇索引,因为一个表中的记录只能以一种物理顺序存放,一般默认是主键索引

而对于普通索引,叶子结点仅存放索引和对应数据主键,也就是非聚簇索引。根据索引找到主键以后,再去主键索引构建的 B+Tree 查询数据,也就是回表。使用非聚簇索引虽然会导致回表,但能大大减少索引的占用空间,当数据发生修改时,也能降低索引的管理成本

再来看联合索引,,假设有:ALTER TABLE test_innodb ADD INDEX idex_name_age(name, age) USING BTREE,结构如图所示:

联合索引建立 B+tree 会以建立索引的顺序来排列数据,首先以 name 字段排序,再以 age 字段来排序。name 如果相同就以 age 来排列顺序,以此类推,最终查到对应数据的主键 ID 之后再回表,这也是联合索引最左匹配原则的原因,只有第一个字段 name 生效了,第二个字段 age 才能生效


索引的设计原则

  1. 选择唯一性索引,可以更快速地确定某条记录
  2. 为经常需要排序、分组和联合操作的字段建立索引
  3. 为经常需要作为查询条件的字段建立索引
  4. 限制索引的数目,索引越多,占用的空间就越多,修改表时对索引的重构和更新也很麻烦
  5. 尽量使用数据量少的索引,索引的值越长,查询速度也会受影响
  6. 尽量使用前缀来索引,对于 TEXT 和 BLOB 类型的字段,进行全文索引会很浪费时间,如果只检索字段前面的若干字段,可以提高速度
  7. 删除不再使用或很少使用的索引
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值