在上一篇文章PostgreSQL之堆表存储(Heap Table)中我们了解了PostgreSQL中堆表的存储结构,以及对于堆表的tuple是如何写入和读取的,不过我们只涉及到如何把想要的tuple从表对应的页面读取出来或者把tuple如何写到页面去,但是关于tuple内部的细节并没有说明。本文我们将着重学习一下tuple的内部结构以及对于增删改操作tuple是如何变化的。
Tuple结构
一个Tuple的结构主要包含三部分:由HeapTupleHeaderData结构定义的头信息,NULL bitmap以及用户数据,如下图所示。
NULL bitmap和用户数据很好理解,那么重点就是这个Tuple的头信息里面都代表了啥,从上图中我们可以看出,header里面重点的信息为t_xmin、t_xmax、t_cid、t_ctid。
- t_xmin - 记录插入此行的事务号txid。
- t_xmax - 记录此行被删除的事务号txid。如果此行未被删除或更新,值为0。
- t_cid - 记录此行是在事务中的第几条SQL,如果是第一条值就是0,第二条值就是1,依次类推。比如对于’BEGIN;INSERT;INSERT;INSERT.COMMIT;'这样一个事务,这行是第三个INSERT中插入的,那么t_cid的值就是2。
- t_ctid - 记录tuple identifier(TID),我们在前面的文章了介绍了TID是由block number+offset number组成的一个二元组,因此这个t_ctid就是一个用二元组表示的TID。如果对应行没有被更新,那么值就代表这个行自己,如果行被更新了,值指向新的行。可以理解这个t_ctid就是一个行的物理地址,对应到哪个页面中的哪条tuple位置。
了解完Tuple的组成结构后,我们再看一下对于insert、update和delete操作对于Tuple的变更情况。
插入(Insert)
以下图为例,