每个 InnoDB 表都有一个称为 「 聚簇索引 」 的特殊索引,通常情况下,这个聚簇索引就是 「 主键 」( primary key ) 。Innodb 使用它存储表中每一行的数据。
如果想要从 查询,插入 和其它数据库操作中获得最佳性能,那么我们就必须了解 InnoDB 如何使用 聚簇索引 来优化每个表的最常见检索和 DML 操作方式
当我们在一个 Innodb 表上定义了一个主键,InnoDB 会默认的使用它作为聚簇索引。
使用 InnoDB 存储引擎时,建议为每个表都添加一个主键。如果该表没有一个逻辑唯一且非空列或列集合,那么可以添加一个带有 AUTO_INCREMENT 约束的自增列作为主键,InnoDB 会自动填充该列。
如果某个 InnoDB 表并没有定义主键。那么 InnoDB 会查找第一个 「 唯一索引 」( UNIQUE Index ) ,因为唯一索引的所有键 ( key ) 都是 NOT ,因此可以用来作为聚簇索引
如果某个 InnoDB 表既没有定义主键,也没有一个合适的唯一索引。InnoDB 会在内部生成一个名为 GEN_CLUST_INDEX 的隐式的聚簇索引
该聚簇索引的键 ( key ) 会包含一个自动为行生成的 ID 值 ( 行号 ) 。
该表中的所有行会按 InnoDB 分配给此类表中的行的 ID 排序。
行 ID 是一个 6 字节的字段,在插入新行时会单调自增。
因此,可以认为物理上的行保存顺序就是该行 ID 排序的排序顺序
聚簇索引如何加快查询速度
通过聚簇索引访问行很快,因为索引搜索直接指向包含所有行数据页 ( data page )。
如果表很大,与那种索引页与数据页分离的 MyISAM 存储引擎相比, 聚簇索引体系结构通常可以节省磁盘 I/O 操作。
非聚簇索引和聚簇索引的关系
非聚簇索引,通常也称之为 「 二级索引 」 ( Secondary Indexes ) 或 「 辅助索引 」 ,一般是指聚簇索引之外的所有其它的索引。
在 InnoDB 中,每个辅助索引中的每条记录都会包含该行的主键列 ( 也就是聚簇索引的键 ) ,以及为辅助索引指定的列。InnoDB 使用此主键值来搜索聚簇索引中的行
如果主键很长,那么辅助索引就会占用更多空间,因此使用短主键是有利的,也是我们所推荐的。
聚簇索引和非聚簇索引的区别
1、首先,我们要认识到聚簇索引和非聚簇索引的划分依据是什么 ?
答案就是 InnoDB 会使用聚簇索索引来保存数据,而非聚簇索引的目的仅仅是加快查询速度
2、在第一点认知基础上,我们就可以知道
聚簇索引是唯一的,一个 InnoDB 表只有一个聚簇索引,而且一定会有一个聚簇索引,如果不存在,Innodb 存储引擎会自动添加一个
非聚簇所以可以有多个,而且只能由用户自己添加,InnoDB 默认并不会创建任何非聚簇索引。
3、非聚簇索引中一定包含了聚簇索引的列值,但反过来却不存在。
因此,使用非聚簇索引查询数据一定会用到聚簇索引,但反过来却不存在。
能在面试中说出这些,这个问题就算是过关了….
干货推荐
附录:MySQL InnoDB 面试题:系列文章