MySQL
索引
1. 概述:
MySQL官方对索引的定义为:索引(index)是帮助MySQL高效获取数据的数据结构(有序)。在数据之外,数据库系统还维护者满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据, 这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引
2 . 好处:
- 提高数据检索的效率,降低数据库的IO成本。
- 通过索引列对数据进行排序,降低数据排序的成本,降低CPU的消耗
劣势:
- 实际上索引也是一张表,该表中保存了主键与索引字段,并指向实体类的记录,所以索引列也是要占用空间的。
- 虽然索引大大提高了查询效率,同时却也降低更新表的速度,如对表进行INSERT、UPDATE、DELETE。因为更新表时,MySQL 不仅要保存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新所带来的键值变化后的索引信息
索引是怎么建立的? 为什么这么快?
索引分类:
● BTREE 索引 : 最常见的索引类型,大部分索引都支持 B 树索引。
● HASH 索引:只有Memory引擎支持 , 使用场景简单 。
● R-tree 索引(空间索引):空间索引是MyISAM引擎的一个特殊索引类型,主要用于地理空间数据类型,通常使用较少,不做特别介绍。
● Full-text (全文索引) :全文索引也是MyISAM的一个特殊索引类型,主要用于全文索引,InnoDB从Mysql5.6版本开始支持全文索引。
- 单值索引:
a. 即一个索引只包含单个列,一个表可以有多个单列索引 - 唯一索引
a. 索引列的值必须唯一,但允许有空值 - 复合索引
a. 即一个索引包含多个列 - 聚簇索引
a. 聚簇索引即索引结构和数据一起存放的索引。主键索引属于聚簇索引
b. 非聚簇索引即索引结构和数据分开存放的索引。
二级索引属于非聚簇索引。
非聚簇索引的叶子节点并不一定存放数据的指针,因为二级索引的叶子节点就存放的是主键,根据主键再回表查数据。 - 覆盖索引
a. 如果一个索引包含(或者说覆盖)所有需要查询的字段的值,我们就称之为“覆盖索引”。
我们知道在 InnoDB 存储引擎中,如果不是主键索引,叶子节点存储的是主键+列值。最终还是要“回表”,也就是要通过主键再查找一次。这样就会比较慢覆盖索引就是把要查询出的列和索引是对应的,不做回表操作!
BTree和B+Tree 建立过程和区别
BTree又叫多路平衡搜索树,一颗m叉的BTree特性如下:
● 树中每个节点最多包含m个孩子。
● 除根节点与叶子节点外,每个节点至少有[ceil(m/2)]个孩子。
● 若根节点不是叶子节点,则至少有两个孩子。
● 所有的叶子节点都在同一层。
● 每个非叶子节点由n个key与n+1个指针组成,其中[ceil(m/2)-1] <= n <= m-1
以5叉BTree为例,key的数量:公式推导[ceil(m/2)-1] <= n <= m-1。所以 2 <= n <=4 。当n>4时,中间节点分裂到父节点,两边节点分裂。
B+Tree为BTree的变种,B+Tree与BTree的区别为:
1). n叉B+Tree最多含有n个key,而BTree最多含有n-1个key。
2). B+Tree的叶子节点保存所有的key信息,依key大小顺序排列。
3). 所有的非叶子节点都可以看作是key的索引部分。