MySQL中Innodb的聚簇索引和非聚簇索引

聚簇索引

数据库表的索引从数据存储方式上可以分为聚簇索引和非聚簇索引(又叫二级索引)两种。Innodb的聚簇索引在同一个B-Tree中保存了索引列和具体的数据,在聚簇索引中,实际的数据保存在叶子页中,中间的节点页保存指向下一层页面的指针。“聚簇”的意思是数据行被按照一定顺序一个个紧密地排列在一起存储。一个表只能有一个聚簇索引,因为在一个表中数据的存放方式只有一种。

一般来说,将通过主键作为聚簇索引的索引列,也就是通过主键聚集数据。下图展示了Innodb中聚簇索引的结构(图片来自《高性能MySQL(第三版)》):

聚簇索引的结构

聚簇索引的结构

这里要特别注意的概念,一个页可以理解为一块具有一定大小的连续的存储区域。相同页内的数据行在物理上是相邻的,因此逻辑上键值相邻的页在物理上可能相隔很远。

在中间的某个节点页中,主键<11的叶子页和11<主键<21的叶子页分别被两个指针所指向,且主键<11的叶子页也有一个指针指向了11<主键<21的叶子页,其余页之间的关系也是一样。

聚簇索引的优点

  1. 聚簇索引将索引和数据行保存在同一个B-Tree中,查询通过聚簇索引可以直接获取数据,相比非聚簇索引需要第二次查询(非覆盖索引的情况下)效率要高。
  2. 聚簇索引对于范围查询的效率很高,因为其数据是按照大小排列的,

聚簇索引的缺点

  1. 聚簇索引的更新代价比较高,如果更新了行的聚簇索引列,就需要将数据移动到相应的位置。这可能因为要插入的页已满而导致“页分裂”。
  2. 插入速度严重依赖于插入顺序,按照主键进行插入的速度是加载数据到Innodb中的最快方式。如果不是按照主键插入,最好在加载完成后使用OPTIMIZE TABLE命令重新组织一下表。
  3. 聚簇索引在插入新行和更新主键时,可能导致“页分裂”问题。
  4. 聚簇索引可能导致全表扫描速度变慢,因为可能需要加载物理上相隔较远的页到内存中(需要耗时的磁盘寻道操作)。

非聚簇索引

非聚簇索引,又叫二级索引。二级索引的叶子节点中保存的不是指向行的物理指针,而是行的主键值。当通过二级索引查找行,存储引擎需要在二级索引中找到相应的叶子节点,获得行的主键值,然后使用主键去聚簇索引中查找数据行,这需要两次B-Tree查找。

总结

下面是Innodb聚簇索引和非聚簇索引的示意图(图片来自《高性能MySQL(第三版)》:

Innodb聚簇索引和非聚簇索引

Innodb聚簇索引和非聚簇索引

### MySQL InnoDB 索引非聚簇索引的区别及工作原理 #### 一、定义 - **索引**是指表中的记录按照索引顺序物理存储的数据结构,在InnoDB中,每张表只能拥有一个索引。通常情况下,这个索引就是主键索引;如果没有显式指定,则会选择第一个唯一且非空的列作为索引[^3]。 - **非聚簇索引**(Secondary Index),又称为辅助索引或二级索引,其叶子节点并不包含完整的行数据,而是只保存了该条目对应的索引键值(通常是主键)。当通过非聚簇索引来查找某一行时,先定位到相应的非聚簇索引项,再利用其中存储的索引键访问实际的数据行[^4]。 #### 二、内部结构差异 对于采用B+树形式构建的索引来说: - 在索引里,叶级节点包含了全部的用户数据字段以及事务ID回滚指针等隐藏信息; - 对于非聚簇索引而言,除了上述提到的仅存有指向对应索引位置的信息外,其余部分均为空白填充物以保持固定大小以便高效管理磁盘空间[^1]。 #### 三、性能影响 由于两者之间存在这样的结构性差别,因此在执行不同类型的查询操作时会产生不同的表现效果: - 使用索引进行范围扫描非常有效率,因为所需读取的数据页连续存在于硬盘上; - 当涉及到频繁更新特定字段而这些字段又被设为了非聚簇索引的一部分时可能会引起较多页面分裂现象从而降低整体性能; - 如果经常基于某些条件过滤并返回大量结果集的话建议创建覆盖索引——即让所涉及的所有列都成为某个非聚簇索引的一部分来减少二次I/O次数[^5]。 ```sql CREATE INDEX idx_name ON table(column_list); ```
评论 12
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值