1、索引的作用
索引出现的目的就是提高数据的查询效率
2、常见的索引模型
1、哈希表 2、有序数组 3、搜索树
哈希表
哈希表:把值放在数组里,用一个哈希函数把key换算成一个确定的位置,把value放在数组的这个位置
缺点:哈希索引做区间查询速度很慢
哈希表适用场景:等值查询的场景
有序数组
有序数组:按顺序存储,查询用二分法就可以快速查询(O(logN))
缺点:更新效率低。想往中间插入数据,就要把后面的数据全部挪的,成本太高
有序数组适用场景:只适用于静态存储引擎。比如要保存2020年某城市的人口信息,这类不会修改的数据
二叉搜索树
二叉搜索树:每个节点的左孩子小于父节点,右孩子大于父节点。查询的时间复杂度O(logN),更新的时间复杂度O(logN)
缺点:树的高度太高,每次查询访问的节点太多,耗时
InnoDB中的索引模型:B+Tree
3、索引类型
用一个例子来说明,下面有一个建表语句:
mysql> create table T(
id int primary key,
k int not null,
name varchar(16),
index (k))engine=InnoDB;
表中 R1~R5 的 (ID,k) 值分别为 (100,1)、(200,2)、(300,3)、(500,5) 和 (600,6),两棵树的示例示意图如下👇:
根据叶子节点内容,索引可以分为主键索引和非主键索引
主键索引的叶子节点存放的是整行数据。InnoDB里主键索引也叫聚簇索引。
非主键索引的叶子节点内容是主键的值。InnoDB里非主键索引也叫二级索引。
主键索引和非主键索引查询的区别:
如果语句是 select * from T where ID=500,即主键查询方式,则只需要搜索 ID 这棵 B+ 树;
如果语句是 select * from T where k=5,即普通索引查询方式,则需要先搜索 k 索引树,得到 ID 的值为 500,再到 ID 索引树搜索一次。这个过程称为回表
结论:基于非主键索引的查询要多扫描一颗索引树,所以要尽量使用主键索引