索引
什么是索引
索引是帮助mysql高效获取数据的排好序的数据结构。
索引存储在数据文件里
索引结构
- 二叉树
- 红黑树
- HASH (mysql)
- B+Tree (mysql)
mysql索引数据结构采用两种方式,HASH数据结构和B+Tree数据结构存放索引。
B+Tree特点
- 非叶子节点不存储data,只存索引(冗余),可以放更多的索引。
- 叶子节点包含所有索引字段
- 叶子节点用指针连接(有序),提高区间的访问性能。
B+Tree索引性能分析
- 一般使用磁盘I/O次数评价索引结构的优劣
- 预读:磁盘一般会顺序向后读取一定长度的数据(页的整数倍)放入内存
- 局部性原理:当一个数据被用到时,其附近的数据也通常会马上被使用
- B+Tree节点的大小设为等于一个页,每次新建节点直接申请一个页的空间,这样就保证一个节点物理上也存储在一个页里,就实现了一个节点的载入只需一次I/O
- B+Tree的度d一般会超过100,因此h(树的高度)非常小(一般为3到5之间)
MyISAM索引实现(非聚集)
- MyISAM索引文件和数据文件是分离的
InnoDB索引实现(聚集) - 数据文件本身就是索引文件。
- 表数据文件本身就是按照B+Tree组织的一个索引数据结构文件。
- 聚集索引-叶子节点包含了完整的数据记录
- 为什么InnoDB表必须有主键,并且推荐使用整形的自增主键?
- 为什么非主键索引结构叶子节点存储的是主键值?(一致性和节省存储空间)
- 联合索引数据结构,非叶子节点存放联合索引值,叶子节点存放值。
- 索引最左前缀原理,由索引数据结构图可以分析出为什么会存在索引最左前缀原理。