MySQL 索引
1.索引本质
-
定义
索引是帮助MySQL 高效获取数据的排好序的数据结构
-
数据结构
-
二叉树
-
红黑树
-
Hash表
-
对索引的key进行一次hash计算就可以定位数据存储的位置
-
很多时候Hash索引要比B+ tree索引更高效
-
仅能满足 = 、in,不支持范围查询
-
hash冲突问题
-
-
B-Tree
- 叶节点具有相同的深度,叶节点的指针为空
- 所有索引元素不重复
- 节点中的数据索引从左到由递增排列
-
B+Tree (B-tree变种)
- 非叶子节点不存储data,只存储索引(冗余),可以放更多的索引
- 叶子节点包含所有索引字段
- 叶子节点用指针连接,提高区间访问的能力
-
-
索引文件
-
MyISAM 存储引擎
索引和数据是分开的
-
.frm 表结构
-
.MYI 索引文件
叶子节点存储的是数据的磁盘地址
-
.MYD 数据文件
-
-
Innodb存储引擎
索引和数据在一起
-
.frm 表结构
-
.ibd文件:数据和索引
叶子节点存储数据
-
-
Innodb 索引实现
-
表数据文件本身就是按照B+tree组织的一个索引结构文件
-
聚集索引-叶子节点包含完整的数据记录
-
为什么建议Innodb表必须建主键,并且推荐整型的自增主键?
数据文件是B+Tree结构,聚集索引叶子节点数据为完整数据,如果不设置主键,mysql会自动添加一列隐藏列rowId 来维护数据的结构
自增主键好处:
- 方便比较
- 占用空间小
- 索引是有序的,自增保证了插入的数据在右边, 发生树分裂和树平衡的概率比较低(影响数据写入的性能)
-
为什么非主键索引结构叶子节点存储的是主键值?(一致性和节省存储空间)
-
联合主键索引的底层存储结构长什么样?
B+tree 树:几个字段一起作为一个索引
排序:按照索引字段的前后进行排序,先比较name —age -----position
-
索引最左前缀原理
索引是排好序的数据结构,必须需要索引的第一个排序的字段值(或者条件)才能确定是有序的;否则需要全表扫描;
-
-
-
innodb 页
-
页目录
记录数据的开始行数据指针、结束行数据指针,方便查找;空间换时间,优化链表的查询
-
页数据
排序插入
-
页头
记录前后页的指针,便于范围查找
-
通过页目录衍生对应的档案目录(每个档案为页),方便页的查找和定位,也可认为每个页为一个叶子节点,对应的档案目录为叶子节点的父节点(主键索引页),和B+Tree 结构相互对应;