聚簇索引和非聚簇索引详解

AaronJonah

已于 2024-07-14 02:57:12 修改

阅读量460

点赞数 14

分类专栏： mysql java 文章标签：数据库 java

于 2024-07-14 02:50:55 首次发布

本文链接：https://blog.csdn.net/weixin_44991038/article/details/140408521

版权

java 同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

mysql

4 篇文章 0 订阅

订阅专栏

在mysql中索引类型包括这几种B + Tree索引、hash索引、全文索引、空间索引。其中B+Tree索引是默认索引类型。且B + Tree（平衡树）索引大致分为两类聚簇索引和非聚簇索引（指MyISM的非聚簇索引）。

一、聚簇索引（Clustered Index）

1、机制

a. 聚簇索引是一种索引方式，InnoDB引擎要求必须有聚簇索引。索引采用B + Tree索引结构实现。聚簇索引是按照表主键顺序构建一个B+Tree结构。其叶子节点存储了是行数据（包含主键值）。

b. 叶子节点中行数据和主键值紧凑的存储在一起，按照主键顺序存储整张表的数据，占用的空间就是整张表的大小。

c. 聚簇索引是通过主键聚集数据，若定义了主键，则主键索引就为聚簇索引。若没定义主键，则表中第一个非空唯一的列作为聚簇索引。都不满足时，InnoDB会建一个隐藏列row-id作为聚簇索引。所以InnoDB引擎的表要求必须有聚簇索引（主键索引）。

d. 二级索引（辅助索引或非主键索引）是在聚簇索引之上创建。是根据索引列构建的 B+Tree结构，在其叶子节点只存储索引列对应的数据值和主键值。二级索引占用的空间比聚簇索引小很多，通常创建二级索引就是为了提高查询效率。一个InnoDB表只能创建一个聚簇索引，可以创建多个二级索引。当索引覆盖扫描时可以直接从B+Tree中获取这些值，不会通过主键查询主键索引（回表查询）获取数据。

2、优缺点

优点

a. 支持范围查询：聚簇索引是按照主键顺序存储的，因此天然支持范围查询。当查询条件包含主键或主键一部分时，数据库利用聚簇索引快速定位到满足条件的数据范围。

b. 查询速度快：聚簇索引决定了数据在磁盘上的物理顺序，使得相关数据在物理上紧凑地存储在一起。数据库可以通过较小的I/O操作读取所需数据。且索引的叶子节点包含了数据行的完整数据，索引覆盖扫描时，可以从二级索引直接获取索引列的值减少二次查询主键索引（所谓回表查询减少磁盘I/O操作），加快查询速度。

c. 存储效率高：聚簇索引包含了行数据，避免了在非聚簇索引中存储主键所需的空间。此外，当表中数据删除或修改时，能更有效的管理和回收磁盘空间，减少空间浪费。

缺点

a. 插入速度慢：聚簇索引的插入严重依赖于插入顺序。按主键顺序插入数据是加载数据页到InnoDB表中速度最快的方式。若插入数据的顺序与主键顺序不一致，可能会出现页分裂（page split）现象，这会降低插入性能，并导致表占用更多的磁盘空间。

解决方案：建议定义一个自增的ID列作为主键，以确保数据按照顺序插入。

b. 更新主键代价大：更新聚簇索引中的主键会导致数据行的移动。因为InnoDB将索引和数据保存在同一个B+Tree中，所以更新主键值需移动数据行到新位置，且可能触发页分裂或页合并，这会降低性能。

解决方案：建议主键列设置为不可更新，或尽量避免更新主键值。

c. 二级索引访问需两次查询：由于二级索引叶子节点只存储了索引列值和主键值，当获取非索引列的数据时，需先找到索引上主键值，再通过主键值去聚簇索引上找行数据，这样需要两次索引查询，降低了访问效率。

解决方案：经常通过二级索引获取非索引列的数据时，可以考虑包括在主键中或作为索引覆盖的一部分，以减少访问数据时的开销。

d. 表结构修改可能更复杂：因聚簇索引将索引和数据紧凑在一起，因此对表结构修改（如添加、删除列或更改列数据类型）可能会更加复杂和耗时。这个操作可能需重建聚簇索引，从而影响数据库的性能和可用性。

解决方案：在修改表结构之前，应仔细评估其对数据库性能的影响，并尽可能在数据库负载较低的时间段操作。