索引的底层数据结构是什么?
总览
- MySQL通过B+树来实现索引,有什么特点?
- 为什么采用B+树,有什么好处?
一、B+树
1、n叉树,每一级可以存储多个节点,降低了树的高度
2、非叶子节点只存储key,不存储数据
3、叶子节点存储key和数据
4、叶子节点的内部,存在多条数据,根据索引进行了有序排列,满足了范围查找
5、叶子节点之间通过一个双向链表,进行相互连接
6、索引失效的情况下,可以按照叶子节点进行顺序遍历
二、索引
数据以文件的形式保存在磁盘里,但需要查询的时候,先将磁盘里的文件内容放到内存里面,然后再进行读取。
- 索引查找过程中,产生磁盘 I/O消耗,而 I/O读取速度相当慢
- 索引的结构组织要尽量减少查找过程中磁盘 I/O的存取次数,减少磁盘 I/O的次数能很大程度地提高MySQL的性能
页
- 逻辑地址——>物理地址:哪个磁道、扇区。扇区是磁盘最小的存储单元
- 主存和磁盘以页为单位交互数据,通常为4KB大小
B+树每次新建一个节点的同时,直接申请一个页的空间,将一个节点的大小设为等于一个页
这样每个节点只需要一次I/O就可以完全载入
范围查找——局部加载原则
三、为什么不用哈希索引作为其数据结构
- 哈希索引数据并不是按照索引值顺序存储,所以也就无法用于排序,不支持任何范围查询
- 当出现哈希冲突的时候,存储引擎必须遍历链表中所有的行指针,逐行进行比较,直到找到所有符合条件的行数据