1.堆表文件的页面布局
表的页面包含了三种类型的数据:
1.堆元组就是数据记录本身,它们从页面底部开始堆叠。
2.行指针–保存着指向堆元组的指针,扮演了元组索引的角色。当一个新的元组被添加进页面中,一个相应的新行指针也会被添加,指向新添加的元组。
3.首部数据(page header data),它包含关于页面的元数据。主要成员变量如下:
/* src/include/storage/bufpage.h /
/
-
磁盘页面布局
-
对任何页面都适用的通用空间管理信息
pd_lsn - identifies xlog record for last change to this page.(本页面最近的变更对应的xlog记录的标识) pd_checksum - page checksum, if set.(页面校验和) pd_flags - flag bits.(标记位) pd_lower - offset to start of free space.(空闲空间的开始位置) pd_upper - offset to end of free space.(空闲空间的结束位置) pd_special - offset to start of special space.(特殊空间的开始位置) pd_pagesize_version - size in bytes and page layout version number.(页面的大小及页面布局的版本号) pd_prune_xid - oldest XID among potentially prunable tuples on page.(本页面中可以修剪的最老的元组的XID)
*/## 堆元组的读写
2.写入堆元组
第二个元组写入之前:
堆表的pd_lower指向第一个元组的指针,第一个指针和pd_upper指向第一个元组。图示如下:
第二个元组写入之后:
第一个元组的指针指向第一个元组,pd_lower指向第二个元组的指针,pd_upper和指向第二个元组的指针指向第二个元组。图示如下:
3.读取堆元组
读取堆元组有两种访问方式:一种是顺序扫描,另一种是索引扫描。
顺序扫描就是通过扫描每一页中的行指针,依序读取页面中的所有元组。
索引扫描会根据索引元组中的key找到目标堆元组的TID,PostgreSQL会根据TID来读取对应的堆元组,所以PostgreSQL可以直接读取所需的堆元组,避免对整个页面进行不必要的扫描。