PostgreSQL DBA(22) - MVCC#2(commit log)

Concurrency Control并发控制是一种机制,在并发进行多个事务时维护一致性(Consistency)和隔离性(Isolation),一致性和隔离性是数据库事务ACID(Atomicity, Consistency, Isolation, Durability) 属性中的C和I。
多版本并发控制(MVCC)是广泛使用的并发控制技术,其主要优势是读不会阻塞写,而写也不会阻塞读。MVCC有很多种变体,PostgreSQL使用一种称为快照隔离Snapshot Isolation (SI)的MVCC变体实现并发控制。
在MVCC中,每个DML操作创建一个数据(包括Index)的新版本,同时保留之前的旧版本。当事务读取数据时,选择其中一个“正确”的版本,以确保各个事务之间的隔离。
Multi Version Heap Tuple 这一章节中提到事务回滚后,新写入的数据仍存储在heap中,PostgreSQL如何识别产生这些数据的事务的状态(提交/回滚/进行中),从而确定哪些tuple可见不可见?PG通过clog(commit log)存储每个事务的状态,在数据库启动时,clog文件会加载到共享内存中,checkpoint时会把共享内存中的事务状态信息刷新到磁盘上.

一、基本概念

事务ID
当一个事务开启时,PostgreSQL事务管理器会为该事务分配一个唯一的事务ID(txid,无符号32bit整型).
通过txid_current()函数可获取当前事务号.


testdb=# begin;
BEGIN
testdb=# select txid_current();
 txid_current 
--------------
         2308
(1 row)
testdb=#

在PG中,以下为系统保留使用的txid:
txid = 0,表示 Invalid txid,用于判断txid的有效性
txid = 1,表示 Bootstrap txid,在intidb初始化数据库时使用
txid = 2,表示 Frozen txid,在事务ID回卷时,通过vacuum进程处理时使用

事务状态
PostgreSQL定义了四种事务状态,分别是IN_PROGRESS(进行中), COMMITTED(已提交), ABORTED(已回滚), 和 SUB_COMMITTED(子事务已提交).


/*
 * Possible transaction statuses --- note that all-zeroes is the initial
 * state.
 * 可能的事务状态 --- 注意初始状态全部为ASCII 0
 *
 * A "subcommitted" transaction is a committed subtransaction whose parent
 * hasn't committed or aborted yet.
 * "subcommitted"事务是指已提交的子事务,而该子事务所在的父事务尚未提交或者回滚.
 */
typedef int XidStatus;
#define TRANSACTION_STATUS_IN_PROGRESS      0x00
#define TRANSACTION_STATUS_COMMITTED        0x01
#define TRANSACTION_STATUS_ABORTED          0x02
#define TRANSACTION_STATUS_SUB_COMMITTED    0x03

二、clog文件

物理文件
clog文件存储在$PGDATA/pg_xact目录中


[xdb@localhost pg_xact]$ ll
total 8
-rw-------. 1 xdb xdb 8192 Jan  8 15:55 0000
[xdb@localhost pg_xact]$

clog segment
如前所述,事务号是无符号的32bit整型,PG通过以下公式逻辑上把clog划分为N个segment:
N = 0xFFFFFFFF/CLOG_XACTS_PER_PAGE/SLRU_PAGES_PER_SEGMENT
其中:
CLOG_XACTS_PER_PAGE定义为


/* We need two bits per xact, so four xacts fit in a byte */
#define CLOG_BITS_PER_XACT  2 -->每个事务状态使用2bits表示
#define CLOG_XACTS_PER_BYTE 4 -->每个Byte可存储4个事务状态
#define CLOG_XACTS_PER_PAGE (BLCKSZ * CLOG_XACTS_PER_BYTE) -->每个page可存储8192*4个事务状态

即CLOG_XACTS_PER_PAGE = 8192*4
SLRU_PAGES_PER_SEGMENT定义为


#define SLRU_PAGES_PER_SEGMENT  32

代入公式中:
N = 0xFFFFFFFF/CLOG_XACTS_PER_PAGE/SLRU_PAGES_PER_SEGMENT
= 0xFFFFFFFF/(8192*4)/32
= 4096

物理上,每个segment有32个Pages(SLRU_PAGES_PER_SEGMENT = 32),则每个segment file大小为8K*32=256K.

三、txid & clog

给定一个事务号,如何获取该事务对应的状态?
PG首先通过该事务号获得该事务状态存储在clog中哪个page中(即pageno),然后再定位存储事务状态的Byte在该page中的偏移以及在该Byte中的偏移.


 #define TransactionIdToPage(xid)    ((xid) / (TransactionId) CLOG_XACTS_PER_PAGE)
 #define TransactionIdToPgIndex(xid) ((xid) % (TransactionId) CLOG_XACTS_PER_PAGE)
 #define TransactionIdToByte(xid)    (TransactionIdToPgIndex(xid) / CLOG_XACTS_PER_BYTE)
 #define TransactionIdToBIndex(xid)  ((xid) % (TransactionId) CLOG_XACTS_PER_BYTE)

如给定事务号2308,根据上述公式可得到:
Page = 2308 / (8192*4) = 0 —> 第0号page
PageIndex = 2308 % (8192*4) = 2308 —> Page内偏移
ByteInPage = 2308 / 4 = 577 —> 该Page内的第577个Byte
ByteIndex = 2304 % 4 = 0 —> 该字节中的首2bits
下面通过实际案例验证
开启事务


testdb=# begin;
BEGIN
testdb=# select txid_current();
 txid_current 
--------------
         2308
(1 row)

查看clog


[xdb@localhost pg_xact]$ hexdump -C ./0000 -s 577 -n 1
00000241  00                                                |.|
00000242

0x00 —> TRANSACTION_STATUS_IN_PROGRESS

提交事务
执行checkpoint,刷新到磁盘上


testdb=# commit;
COMMIT
testdb=# checkpoint;
CHECKPOINT

查看clog


[xdb@localhost pg_xact]$ hexdump -C ./0000 -s 577 -n 1
00000241  01                                                |.|
00000242

值为0x01 —> TRANSACTION_STATUS_COMMITTED

重新开启一个事务2309,回滚该事务,clog中的值应为0x09(二进制值为:0000 1001)


testdb=# begin;
BEGIN
testdb=# select txid_current();
 txid_current 
--------------
         2309
(1 row)
testdb=# select 2308%4;
 ?column? 
----------
        0
(1 row)
testdb=# rollback;
ROLLBACK
testdb=# checkpoint;
CHECKPOINT
testdb=#

clog文件中的内容0x09,与预期中的一致.


[xdb@localhost pg_xact]$ hexdump -C ./0000 -s 577 -n 1
00000241  09                                                |.|
00000242
[xdb@localhost pg_xact]$

四、参考资料

Concurrency Control

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/6906/viewspace-2375119/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/6906/viewspace-2375119/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值