先来看看二叉树
二叉树是大家熟知的一种树,用它来做索引行不行,可以是可以,但有几个问题:
1. 如果索引数据很多,树的层次会很高(只有左右两个子节点),数据量大时查询还是会慢
2. 二叉树每个节点只存储一个记录,一次查询在树上找的时候花费磁盘IO次数较多
所以它并不适合直接拿来做索引存储,算法设计人员在二叉树的基础之上进行了变种,引入了B树的概念
如上图可知BTREE有以下特点:
1.不再是二叉搜索,而是N叉搜索,树的高度会降低,查询快
2.叶子节点,非叶子节点,都可以存储数据,且可以存储多个数据
3.通过中序遍历,可以访问树上所有节点
当我们利用索引查询的时候,不可能把整个索引全部加载到内存里,能做的只有逐一加载每一个磁盘页,这里的磁盘页对应着索引树的节点,也就是说索引树越低,我们的进行的磁盘IO数就越少,也就越能提高效率
B树被作为实现索引的数据结构被创造出来,是因为它能够完美的利用“局部性原理”,其设计逻辑是这样的
1.内存读写快,磁盘读写慢,而且慢很多
2.磁盘预读:磁盘读写并不是按需读取