我们在MySQL中的数据一般是放在磁盘中的,读取数据的时候肯定会有访问磁盘的操作,磁盘中有两个机械运动的部分,分别是盘片旋转和磁臂移动。盘片旋转就是我们市面上所提到的多少转每分钟,而磁盘移动则是在盘片旋转到指定位置以后,移动磁臂后开始进行数据的读写。那么这就存在一个定位到磁盘中的块的过程,而定位是磁盘的存取中花费时间比较大的一块,毕竟机械运动花费的时候要远远大于电子运动的时间。当大规模数据存储到磁盘中的时候,显然定位是一个非常花费时间的过程,但是我们可以通过B树进行优化,提高磁盘读取时定位的效率。
为什么B类树可以进行优化呢?我们可以根据B类树的特点,构造一个多阶的B类树,然后在尽量多的在结点上存储相关的信息,保证层数(树的高度)尽量的少,以便后面我们可以更快的找到信息,磁盘的I/O操作也少一些,而且B类树是平衡树,每个结点到叶子结点的高度都是相同,这也保证了每个查询是稳定的。
特别地:只有B-树和B+树,这里的B-树是叫B树,不是B减树。没有B减树的。
以下摘自【程序员小灰】
什么是B树
一个m阶的B树具有如下几个特征:
1、根结点至少有两个子女。 2、每个中间节点都包含k-1个元素和k个孩子,其中 m/2 <= k <= m 3、每一个叶子节点都包含k-1个元素,其中 m/2 <= k <= m 4、所有的叶子结点都位于同一层。5、每个节点中的元素从小到大排列,节点当中k-1个元素正好是k个孩子包含的元素的值域分划。
下面以3阶B树开始学习
这棵树中,重点看(2,6)节点。该节点有两个元素2和6,又有三个孩子1,(3,5),8。其中1小于元素2,(3,5)在(2,6)之间,8大于(3,5),正好符合上面所列的特征。
B树查询的流程:
比如上面的3阶B树查询数值5。
第1次IO:
第2次IO: