概念
索引是帮助 MySQL 高效获取数据的数据结构。可以简单理解为排好序的快速查找数据结构。
数据结构
MySQL 使用的是 Btree 索引
数据库索引所用到的数据结构跟跳表非常相似,叫作 B+ 树。不过,它是通过二叉查找树演化过来的,而非跳表。
改造二叉查找树
为了让二叉查找树支持按照区间来查找数据,树中的节点并不存储数据本身,而是只是作为索引。除此之外,我们把每个叶子节点串在一条链表上,链表中的数据是从小到大有序的。
改造之后,如果我们要求某个区间的数据。我们只需要拿区间的起始值,在树中进行查找,当查找到某个叶子节点之后,我们再顺着链表往后遍历,直到链表中的结点数据值大于区间的终止值为止。所有遍历到的数据,就是符合区间值的所有数据。
二叉查找树,经过改造之后,支持区间查找的功能就实现了。不过,为了节省内存,如果把树存储在硬盘中,那么每个节点的读取(或者访问),都对应一次磁盘 IO 操作。树的高度就等于每次查询数据时磁盘 IO 操作的次数。比起内存读写操作,磁盘 IO 操作非常耗时,所以我们优化的重点就是尽量减少磁盘 IO 操作,也就是,尽量降低树的高度,通过把索引构建成 m 叉树,高度就会比二叉树要小。
B+树与B- 树、B树的区别
B- 树就是 B 树,英文翻译都是 B-Tree,这里的“-”并不是相对 B+ 树中的“+”,而只是一个连接符。
B 树实际上是低级版的 B+ 树,或者说 B+ 树是 B 树的改进版。
B 树跟 B+ 树的不同点主要集中在这几个地方:
B+ 树中的节点不存储数据,只是索引,而 B 树中的节点存储数据;
B 树中的叶子节点并不需要链表来串联。
也就是说,B 树只是一个每个节点的子节点个数不能小于 m/2 的 m 叉树。
优缺点
优势:
提高数据检索的效率,降低数据库的IO成本。 通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗。
劣势:
虽然索引大大提高了查询速度,同时却会降低更新表的速度,如对表进行INSERT、UPDATE和DELETE。因为 更新表时,MySQL不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为 更新所带来的键值变化后的索引信息。 实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录,所以索引列也是要占用空间 的。
分类
单值索引
概念:即一个索引只包含单个列,一个表可以有多个单列索引
唯一索引
概念:索引列的值必须唯一,但允许有空值
主键索引
概念:设定为主键后数据库会自动建立索引,innodb为聚簇索引
复合索引
概念:即一个索引包含多个列
创建时机
适合创建索引的情况
主键自动建立唯一索引;
频繁作为查询条件的字段应该创建索引
查询中与其它表关联的字段,外键关系建立索引
单键/组合索引的选择问题, 组合索引性价比更高
查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度
查询中统计或者分组字段
不适合创建索引的情况
表记录太少
经常增删改的表或者字段