定义
索引是帮助MySQL高效获取数据的排好序的数据结构
索引数据结构
-
二叉树(不适用)
弊端:对于线性增长的数据依然要走全表扫描。
-
红黑树(二叉平衡树)(不适用)
弊端:对于数据量大的情况,树的高度(例n=20)就会很高,此时如果我们需要查询的索引数据位于叶子节点,至少要经过20次查找(磁盘io),所以性能难以提升。
另外,红黑树会自平衡(自旋),也会对性能有一定影响。
-
Hash表 <MySQL使用的索引结构>
通过对索引节点的hash运算,得出索引对应的数据的磁盘文件地址指针,然后根据地址指针直接获取数据。
弊端:
——不支持范围查询;
—— 存在hash冲突。
应用场景即为数据量很大,但是范围查询又很少,同时对性能要求很高等可以使用。 -
B-tree (不适用)
-
B+Tree (B-tree的变种)<MySQL使用的索引结构>
不同引擎索引实现
MyISAM:
MyISAM索引文件和数据文件是分离的(非聚集)
InnoDB
- 索引实现(聚集)
- 表数据文件本身就是按 B+Tree 组织的一个索引结构文件
- 聚集索引-叶子节点包含了完整的数据记录
- 为什么InnoD 表必须有主键,并且推荐使用整型自增主键——因为表数据本身就是B+tree的结构文件,所以一定要主键,不设置的话MySQL会自动建一个主键,自增主键便于维护索引,有助于范围查询的性能提升,同时占用磁盘空间较少。
- 为什么非主键索引结构叶子节点存储的是主键值?()
总结:
MyISAM —— 叶子节点存放的是数据所在行的磁盘地址指针,即索引文件和数据文件是分离的(非聚集)
InnoDB —— 叶子节点包含了完整的数据记录(聚集)