当数据库的数据多时会导致索引也很大,因此要将索引存储在磁盘中,磁盘io效率低,为了减少磁盘io次数,所以也要减少树的高度,b+树叶子结点相邻的数据在物理上也是相邻的,b+树node大小被设置为一个页,只需要一次io就能完全载入相邻的信息,基于局部性加载,也可以加载几页相邻的数据到内存中。
Hash索引:
Hash索引底层是哈希表,所以多个数据在存储关系上是完全没有任何顺序关系的,所以,对于区间查询是无法直接通过索引查询的,就需要全表扫描。所以,哈希索引只适用于等值查询的场景。而B+ 树是一种多路平衡查询树,所以他的节点是天然有序的,所以对于范围查询的时候不需要做全表扫描。
二叉查找树:
无法保证平衡,会退化为链表。
平衡二叉树:
旋转操作效率太低。
红黑树:
树仍然太高,IO次数太多。
B+树:
在B树的基础上,将非叶节点改造为不存储数据纯索引节点,进一步降低了树的高度;此外将叶节点使用指针连接成链表,范围查询更加高效。