什么是“聚簇”?
聚簇是为了提高某个属性(或属性组)的查询速度,把这个或这些属性(称为聚簇码)上具有相同值的元组集中存放在连续的物理块。
【聚簇索引】和【非聚簇索引】概念
- 聚簇索引: 将【数据存储】与【索引】放到了一块,找到索引也就找到了数据;
- 非聚簇索引:将【数据存储】与【索引】分开存储,索引结构的叶子节点指向了数据的对应行;
二级索引:因为聚集索引只能有一个,所有同一个表其他字段只能是二级索引也就是非聚集索引;
【聚簇索引】和【非聚簇索引】区别
- 聚集索引: 表中存储的数据按照索引的顺序存储,检索效率比普通索引高,但对数据新增/修改/删除的影响比较大;它的【B+树】的叶子节点上的data就是数据本身;
- 非聚集索引:不影响表中的数据存储顺序,检索效率比聚集索引低,对数据新增/修改/删除的影响很小;它的【B+Tree】的叶子节点上的data,并不是数据本身,而是数据存放的地址;
存储引擎 | 索引类型 | 主键叶子节点 | 非主键叶子节点 |
MyISAM | 非聚簇 | 数据地址 | 数据地址 |
InnoDB | 聚簇 | 全部数据 | 主键值 |
- InnoDB----聚簇索引;myISAM----非聚簇索引;
- 聚簇索引默认是主键,如果表中没有定义主键,InnoDB 会选择一个唯一且非空的索引代替(类似oracle中的RowId);
- 主键建议使用自增id,因为主键是相邻的,那么对应的数据一定存在相邻的硬盘上,方便查找;
- 表中行的物理顺序和索引中行的物理顺序是相同的
- 总体来说:聚簇索引 比 非聚簇索引 要好
聚簇索引:若根据id查,直接找到数据;若根据name查,先根据name找到对应的id,然后再根据id找到数据;
非聚簇索引:主键id叶子节点对应的是独立空间的数据地址,辅助键name叶子节点对应的也是独立空间的数据地址,所以根据主键查和根据辅助键查区别不大;