一、什么是索引
索引其实是一种数据结构,其作用类似于书的目录。
好处是
- 减少数据的扫描数量,提高查询效率。
- 将随见IO变为顺序IO
缺点是:
- 随着数据量的变大,索引的存储空间也变大
- 维护和修改索引,成本很高
二、索引的底层原理
主要分为3种:Hash索引、B树索引、B+树索引。
Hash索引,顾名思义,与Hash相关,底层是哈希表。其相关原理,在这里就不再赘述。
B树,(B代表的不是binary,而是balance),是一种多路平衡查找树。m阶的B树定义:
- 根节点至少有两个子节点
- 非根节点,非叶子节点,至少有ceil[m/2]个子节点,至多有m个子节点
- 叶子节点在同一层,且不包含任何信息
- 非根非叶子节点,最少有ceil[m/2]-1个关键字,最多有m-1个关键字
![bce0e0c12c16242383256bcead0fd7ab.png](https://img-blog.csdnimg.cn/img_convert/bce0e0c12c16242383256bcead0fd7ab.png)
B+树,是在B树的基础上发展而来的。其和B树的不同在于:(a)B树的非叶子节点包含数据和索引值,而B+树非叶子节点只索引值,数据存储在B+树的叶子结点中, (b)B+树的叶子节点之间有双向指针相连。
Mysql的InnoDB引擎采用的索引结构就是B+树,B树并不是一无是处,MongoDB采用的B树索引。不同的优劣,只是针对不同的使用场景。Mysql是关系型数据库,很多时候会连表查询,很多时候会按顺序扫描。MongoDB是非关系型数据库,以K-V键值对的形式存储数据。每一个value都是一个对象。
三、几种常见的术语
1、回表
首先,需要了解InnoDB中,聚簇索引和非聚簇索引的区别。
聚簇索引,一个表只有一个。表有主键,主键就是聚簇索引;没有主键,非空的唯一索引就是聚簇索引;再者就是row-id作为隐藏的聚簇索引。
非聚簇索引,一个表可以有多个,例如,普通索引,唯一索引等。
二者的底层结构都是B+树,主要区别在于,聚簇索引叶子节点中包含的是完整的数据记录,而非聚簇索引叶子中包含的是对应记录的主键。
回表指的是,查找数据时,使用的是非聚簇索引,得到数据的主键后,再根据聚簇索引得到完整的数据。
2、覆盖索引
一句话概括:查询语句中的索引字段,包含对应的查询字段。
例如,
CREATE TABLE `t`(
`I_ID` bigint(20) not null auto_increment comment '自增主键',
`name` varchar(30) not null default '' comment '姓名',
`age` int not null default 0 comment '年龄'
primary key (`I_ID`),
key `key_name_age` (`name`, `age`)
)Engine = innodb default charset = utf8mb4 comment='学生表';
select name, age from t where name = 'lisi' and age = 20
上述select 语句中的 name、age字段是联合索引包含需要查询的字段,不需要根据主键再次回表查询。解决覆盖索引常用的方法也是建立联合索引。