本文简单介绍了PG数据表的存储基础知识以及可用于解析数据页Page内容的pageinspcet插件。
一、PG数据表存储基础
一般来说,数据表数据物理存储在非易失性存储设备上面,PG也不例外。如下图所示,数据表中的数据存储在N个数据文件中,每个数据文件有N个Page(大小默认为8K,可在编译安装时指定)组成。Page为PG的最小存取单元。

普通数据表存储结构
数据页(Page)
数据页Page由页头、数据指针数组(ItemIdData)、可使用的空闲空间(Free Space)、实际数据(Items)和特殊空间(Special Space)组成。
A、页头存储LSN号、校验位等元数据信息,占用24Bytes
B、数据指针数组存储指向实际数据的指针,数组中的元素ItemId可理解为相应数据行在Page中的实际开始偏移,数据行指针ItemID由三部分组成,前15位为Page内偏移,中间2位为标志,后面15位为长度,详细解析可参见附录
C、空闲空间为未使用可分配的空间,ItemID从空闲空间的头部开始分配,Item(数据行)从空闲空间的尾部开始
D、实际数据为数据的行数据(每种数据类型的存储格式后续再解析)
E、特殊空间用于存储索引访问使用的数据,不同的访问方法数据不同
二、pageinspect插件
如何简单快速方便的查看Page中的内容?不同于Oracle各种dump,在PG中可以方便的使用pageinspect插件提供的各种函数查看Page中的内容。
安装
得益于PG良好的扩展性,安装很简单:
#cd $PGSRC/contrib/pageinspect
#

本文探讨了PostgreSQL数据表的存储基础,重点是数据页Page的结构,包括页头、数据指针数组、空闲空间、实际数据和特殊空间。此外,还介绍了pageinspect插件的安装和简单使用,该插件允许方便地查看Page内容。
最低0.47元/天 解锁文章

被折叠的 条评论
为什么被折叠?



