MySQL 中的Innodb 聚簇索引和Myisam 的非聚簇索引

最新推荐文章于 2024-07-14 02:50:55 发布

石硕页

最新推荐文章于 2024-07-14 02:50:55 发布

阅读量429

点赞数

分类专栏：数据库文章标签：数据库索引聚簇索引非聚簇索引

数据库专栏收录该内容

20 篇文章 2 订阅

订阅专栏

簇（cù）：数据存储在硬盘的时候，是以簇为单位。所以无论文件大小是多少，除非正好是簇大小的倍数，否则文件所占用的最后一个簇或多或少都会产生一些剩余的空间。而且这些空间不能给其他文件使用，即使这个文件只有0字节，也不允许两个文件或两个以上的文件共用一个簇，不然会造成数据混乱。【百度百科】

在刚开始接触到聚簇索引和非聚簇索引的时候，直观理解成聚簇索引就是在索引在一起，非聚簇索引就是索引不在一起。这个理解不痛不痒。

随着研究深入，发现Mysql 中的索引现在是使用的B+树结构存储，而对于不同的存储引擎，Innodb 采用的是聚簇索引，Myisam 使用的是非聚簇索引。

聚簇索引与非聚簇索引的区别

想象一个场景，图书馆的藏书都是相同专业的书籍放在相近的区域，你在去图书馆借计算机专业书的时候，首先会根据书名查询所在区域，比如查询出A区3号书架2排，你按照这个方向查找过去，在这个地方就能找到这本书，而且你会发现，整个3号书架都是计算机专业的书籍，整个2排可能都是同一个书名的不同版本，不能出版社的书籍。这种你要找的书籍和给到你的索引是同一个时，就是聚簇索引。

再假想一个场景，你去医院找某个医生，可能先看到的科室分布的地图，你查询到科室所在区域是B座2楼1单元，你按照这个地址找过去的时候，那具体的医生在哪个房间，科室的前台可能再会告诉你具体的医生在哪个房间，你再去找对应的房间（可能这个房间不在这个区域）。这种你要找的医生和给到你的索引不是同一个地方，但是在这个地方又给你提供了房间，这就是非聚簇索引。

在《数据库原理》一书中对聚簇索引和非聚簇索引的区别解释是：

聚簇索引的叶子节点就是数据节点

非聚簇索引的叶子节点仍然是索引节点，只不过有指向对应数据块的指针。

索引结构

Innodb中聚簇索引的结构

索引的叶子节点也储存了数据

聚簇索引的优点

聚簇索引将索引和数据行保存在同一个B-Tree中，查询通过聚簇索引可以直接获取数据，相比非聚簇索引需要第二次查询（非覆盖索引的情况下）效率要高。
聚簇索引对于范围查询的效率很高，因为其数据是按照大小排列的

聚簇索引的缺点

聚簇索引的更新代价比较高，如果更新了行的聚簇索引列，就需要将数据移动到相应的位置。这可能因为要插入的页已满而导致“页分裂”。
插入速度严重依赖于插入顺序，按照主键进行插入的速度是加载数据到Innodb中的最快方式。如果不是按照主键插入，最好在加载完成后使用OPTIMIZE TABLE命令重新组织一下表。
聚簇索引在插入新行和更新主键时，可能导致“页分裂”问题。
聚簇索引可能导致全表扫描速度变慢，因为可能需要加载物理上相隔较远的页到内存中（需要耗时的磁盘寻道操作）。

Myisam 非聚簇索引的结构

在Myisam 中，一个数据表table，它是由 table.frm、table.myd 以及table.myi 组成。table.myd记录了数据，table.myi记录了索引的数据。在用到索引时，先到table.myi（索引树）中进行查找，取到数据所在table.myd的行位置，拿到数据。所以myisam引擎的索引文件和数据文件是独立分开的，这就是非聚簇索引。