常见的索引
索引按照物理实现方式可以分为两种: 聚簇索引
和 非聚簇索引
我们也把非聚簇索引称为 二级索引
或者 辅助索引
。
聚簇索引
聚簇索引
并不是一种单独的索引类型,而是一种 数据存储方式
(所有的用户记录都存储在了叶子节点),也就是所谓的 索引即数据,数据即索引
术语 “聚簇” 表示数据行和相邻的键值聚簇的存储在一起
特点
总结:
当记录中的主键,被层层存储这样的树就叫做
聚簇索引
- 使用记录主键值的大小进行记录和页的排序,包括三个方面的含义:
页内
的记录是按照主键的大小顺序排序成的一个单项链表
。- 各个存放
用户记录的页
也是更具页中用户记录的主键大小。 - 存放
目录项记录的页
分为不同的层次,在同一层次中的页也是根据页中目录项记录的主键大小排序排成一个双向链表
。
- B+树的
叶子结点
存储的是完整的用户记录。- 所谓完整的用户记录,就是指这个记录中存储了所有列的值。
我们把具有这两种特性的B+树称为 聚簇索引
, 所有完整的用户记录都被存放在这个 聚簇索引
的子节点处。
这种聚簇索引并不需要我们在MySQL语句中显式的使用 INDEX
语句去创建, InnoDB
存储引擎会 自动
的为我们创建。
优点
数据访问更快
,因为聚簇索引和数据保存在同一个 B+树中,因此从聚簇索引中获取数据比非聚簇索引
更快。- 聚簇索引对于主键的
排序查找
和范围查找
速度非常快 - 按照聚簇索引排列顺序,查询显示一定范围数据的时候,由于数据都是紧密相连,数据库不用从多个数据块中提取数据,索引
节省了大量的IO操作
缺点
插入速度严重依赖于插入顺序
,按照主键的顺序插入是最快的方式,否则会出现页分裂,严重影响性能。因此,对于InnoDB表,我们一般都会定义一个自增的ID列为主键
更新主键的代价很高
,因为我们将会导致被更新的行移动。因此,对于InnoDB表,我们一般定义主键为不可更新
。二级索引访问需要两次索引查找
,第一次找到主键值,第二次更具主键值找到行数据。
限制
- 对于MySQL数据库目前只有InnoDB数据引擎支持聚簇索引,而MyISAM并不支持聚簇索引。
- 由于数据物理存储排序方式只能有一种,所以每个MySQL的
表只能有一个聚簇索引
。一般情况下就是该表的主键。 - 如果没有定义主键,InnoDB会选择
非空的唯一索引
代替。如果没有这样的索引,InnoDB会隐式的定义一个主键来作为聚簇索引。 - 为了充分利用聚簇索引的特性,所以InnoDB表的主键列尽量
选用有序的顺序id
,而不建议使用无序的id,比如 UUID、MD5、HASH等。
二级索引(辅助索引,非聚簇索引)
如果我们使用别的列作为条件搜索怎么办呢?肯定不能从头到尾遍历。
我们可以 多建几颗B+树
,不同的B+树种的数据采取不同的排序规则。如下图我们使用c2创建一颗树。
这个树存储的是 目标查询字段和主键值。当找到目标字段后会通过主键值从聚簇索引中查询具体记录
一个表 只能有一个聚簇索引
以为只能有一种排序存储方式,但可以有多个 非聚簇索引
,也就是多个索引目录提供数据检索。
联合索引
我们也可以同时以多个列的大小作为排序规则,也就是同时为多个列建立索引。
- 先按照1字段排序,如果1字段相同那么按照2字段来排序
同那么按照2字段来排序