POSTGRESQL 底层存储原理探索

最新推荐文章于 2025-03-04 22:11:43 发布

Austindatabases

最新推荐文章于 2025-03-04 22:11:43 发布

阅读量4.1k

点赞数 3

本文链接：https://blog.csdn.net/liuhuayang/article/details/106681722

版权

要想使用一种数据库，一般有两种方法，不懂先从底层的知识来，通过以前学到的数据库的知识对比，新数据库的底层知识，快速了解这种数据库，另外是从操作入手，不管底层知识，直接操作，从操作中体会新数据库和以前接触过的数据库之间的差异。

一般我比较喜欢第一种，今天就来搞一搞 POSTGRES QL 的底层存储知识。

1 从对比来看POSTGRESQL 的数据库（非INSTANCE 那个级别的数据库），SQL SERVER 的DBA 可以和理解 SQL SERVER 对INSTANCE 和数据库的概念一样，不需要费劲，MYSQL 的DBA 也是一样。 ORACLE的DBA 需要理解，这里的数据库就是ORACLE中一堆同样用户下的表的集合，叫数据库。非INSTANCE的那个概念。

下图就是一个POSTGRES QL INSTANCE 中包含的数据库,有一些事自建的，有些是系统的数据库， oid是每个数据库的OBJECT_ID，这点很类似SQL SERVER 中每个对象都有一个OBJECT_ID。

创建一个表company, 这里展示他的表结构，通过查询COMPANY的表结构，发现查询语句的写法的确和PL/SQL 类似，看来SQL SERVER 和MYSQL 在处理表关联是一路的， ORACLE 和 POSTGRES QL 在写表关联是一个思路。

那这个表的实体文件到底存在哪里，

一般一个表会有三个文件，表的数据文件， _FSM _VM 三个文件，组成，FSM 和 VM 和表的数据页面管理，以及数据清除有关。

POSTGRES QL 对用户是比较友好的，例如你要查当前库中的COMPANY表的一些信息，这是其他数据库都做的不足到的。

POSTGRES QL 仅仅需要输入 \dt company,直接将结果就输出了

相对其他数据库要简单的快速方便的多。

通常POSTGRESQL 中每个表是存储在多个固定的 8KB的页面中的，表存储在HEAP的文件中，并且由于页面的组织方式和 ORACLE 有些相似，通过item 指向数据块的方式，下图画的比较粗糙，实际上POSTGRESQL在每个页面中的设计是很巧妙的。

通过相关函数（POSTGRESQL 默认不按照，自己源码编译，此处不再介绍安装过程）

通过上面的命令我们可以分析POSTGRESQL 的页面基本信息

如果我们想知道这个页面到底有多少空间还可以使用，使用 UPPER - LOWER 就可以得到我们剩下的空间，并且头部占用 24B 每个 ITEM 占用 4B，由于元祖（data）的长度并非完全一致，所以这里面通过 alignmentpadding 来补齐元祖，提高I/O的性能，一般64位的机器的长度为8K

下面我们继续分析，POSTGRESQL 中的元祖信息（DATA），通过下图

我们可以看到，每一个数据行对应的CTID 和每一行占用的PAGE中的大小

（SQL SERVER 里面也有类似的函数可以查看，并且一眼就可以看出和 ORACLE, POSTGRESQL 之间的数据页面的组织不同）