一、计算机存储概述
计算机的存储一般分为两种:1、内存存储,2、硬盘存储
内存的存储一般用作cpu的高速缓存,而我们的硬盘的数据可永久存储。现在我们使用的硬盘一般分为机械硬盘和固态硬盘两种,前者的读取数据速度较慢,但是造价低,后者读取数据速度快,但是造价较高。考虑到成本因数,一般较多使用的还是机械硬盘。因为机械硬盘的读取数据较慢,所以我们在读取机械硬盘的数据时,要尽量减少IO操作。通常情况下,计算机在读取数据的时候,不会将全部的数据都读取出来,一般会读取一定长度的数据放入内存中去,读取数据的长度基本单位我们用页来表示。页是计算机管理存储器的逻辑块,硬件及操作系统往往将主存和磁盘存储区分割为连续大小相等的块,每一个存储块称为一页(一般为4K)。我们将一个节点的大小看作一页,这样我们在每一个节点上读取数据只需要进行一次IO操作即可。
如下图所示,如果用二叉树来作为读取的数据结构的话,由于二叉树最多只能有两个节点,那么必然会导致树的高度增加,那么在读取一个高度比较高的节点的时候,就会进行多次的IO操作,这样会导致数据读取的性能下降。
为了解决这种问题,我们引入了B树的数据结构,如下图所示。其实就是增加了同一个高度的节点数。这样我们在读取数据的时候就可以减少IO操作。接下来下面我们来介绍一下B树。
二、B树和B+树
1、B数
在B树中我们规定所有的叶子节点都在同一层;
1、有两个子节点的节点叫二节点,二节点要么有两个子节点,要么没有节点,
2、有三个节点的节点叫三节点,三节点要么有三个子节点,要么没有节点。
在B树中,我们用阶来表示最高节点数。比如2-3树称为3阶B数,2-3-4树称为4阶B数。
2、B+数
B+数的叶子节点用来存储数据,非叶子节点只用来存储索引信息,叶子节点最右边的指针指向下一个相邻的叶子节点,所有的叶子节点组成一个有序链表。