之前学习MySQL时,一直没搞清楚聚簇索引和非聚簇索引的区别,原因还是对MYSQL底层数据存储的原理没搞清楚,其实搞清楚原理,那么理解起来就会非常快速,也非常简单;今天这里简单总结记录一下,欢迎大家纠正补充;
大家通过这个图帮助理解一下:
1.引入
首先,我们想一下,同一行数据,MYSQL存储会存储多份吗?肯定不会,肯定要节省空间的嘛。所以一条完整的数据只会存储在主键索引树的叶子节点中(此时主键索引就是聚簇索引)。而通过其他的索引(普通索引)也能找到完整的数据,那么MySQL是怎么找到的呢?其他的普通索引的叶子节点存储的是主键索引的值,找到主键索引再通过主键查找到目标数据(此过程称为回表查询)
2.聚簇索引和非聚簇索引
局簇索引和非聚簇索引的区别:数据和索引树是否分开存储;数据存储在叶子节点的叫聚簇索引,否则是非聚簇索引;MyISAM中不存在聚簇索引(因为叶子节点存放的都是指向记录的地址,而不是数据);Innodb中一般主键索引是聚簇索引(如果没有主键,那就是唯一键,如果没有唯一键,MySQL会自动启用一个6字节的rowid作为隐藏的主键,以其创建聚簇索引)
3.回表查询
回表查询:使用普通索引查询时,当前索引树上的叶子节点存放的数据不是查询所需的全部数据时,此时就需要通过主键key返回主键聚簇索引树上查询所需要的数据,此时称为回表查询;与之对应的,如果查询的数据在普通索引树中能够全部找到,那么称之为覆盖索引;