这一章主要是关于表空间的内容。我们可以把表空间看作是页池
另外这一章的逻辑比较复杂,层级关系较多。在阅读书籍/我的博客时,一定要牢记这个顺序:表空间 > 组 > 段 > 区 > 页
9.1
这一节主要是复习前面章节的知识。
首先是常用的页面类型有哪些:
其次是页面的通用部分。基本是任何种类的页面都有File Header和File Trailer。其中后者主要是用于校验。前者的组成相对比较复杂:
9.2
这一节内容很多。都是关于独立表空间结构的。
首先要介绍的是“区”这个概念。
区
每个区默认1MB。对于16KB的页来说,就是64个页。
之所以引入区的概念,是为了降低随机磁盘io。
传统的数据库都是使用机械硬盘的,机械硬盘的主要io开销在磁臂旋转上,如果是随机磁盘io,则磁臂会不停的转来转去,效率低。
如果想避免这种情况,就需要让磁臂尽量少的旋转,想要实现这种场景就需要让数据页在磁盘中连续存储。这样磁臂就不会乱转,只会一次往下转一点点。
而想要让磁盘中的页连续,就需要在申请空间的时候申请一大块磁盘空间,而非一个单独页那么大的空间,那样很有可能不连续。
因此,我们有了区的概念。一个区由64个页组成,以区为单位进行申请,就会很大程度上避免页的存储不连续问题。
而256个区放在一起又会形成“组”。
根据层级关系可知,每个组对应着大量的页面。而其中必然有一些页面是用来描述组的元信息以及区的元信息的(其实还有段的一些元信息)。描述这些信息的页是第一个组的前三个页和其他所有组的前两个页。
下面介绍一下这些页面都是干什么用的。
FSP_HDR:这个页面记录了表空间的元信息以及本组所有的区的元信息
XDES:和FSP基本相同,也是记录本组所有区的元信息。区别在于它不会再记录表空间的元信息了。
IBUF_BITMAP:用来存储change buff的元信息。change buffer主要是用来缓存操作的。对磁盘上页面的修改操作会被缓存在change buffer中,等到页面因为某些事件实际加载到内存中时再进行执行。原来change buffer只缓存插入操作,因此原来叫insert buffer。
INODE:记录了段的相关信息。段会在后面进行介绍。
段
之前提到区是一组页面的集合。对于B+树来说,一组页面里既有叶子节点,又有内部叶节点。如果区中什么都存储,则会让我们在遍历叶子结点的链表时效率很低。
因此,我们会把一类页面放到一些区中,另一类放到不同的区中。这种只存储一类页面的区的集合就叫段。从这里也不难看出,段是个逻辑概念。
另外,段还不只是区,段是区和一些零散页面的组合。之所以这么说,是因为有些页面既不属于叶子结点那个区,又不属于内部叶节点那个区,可它们也应该被划分到段中。所以严格来说,段是区和零散页面的组合。
那么什么样的页面不是内部叶子结点那个区,也不是普通叶子结点那个区呢?这里要引出一个概念,就是碎片区。
碎片区
由上文可知,内部叶节点区的集合 和 叶子结点区的集合分别对应一个段。可是即使每种页面只有一个区,那也需要2MB的空间。如果一个表里还没什么记录就要2MB的空间