PostgreSQL之PITR

1、什么是PITR ?

PITR: 全称是Point-In-Time-Recover (时间点恢复),是PG从8.0版本开始引入的一个特性,该特性可以使用基础备份和连续归档日志将数据库集群恢复到任意时间点。

2、什么是基础备份?怎么获取基础备份?

在pg中,也是从8.0版本中引入了在线物理全备份,运行中的整个数据库集群的快照(即物理备份数据)被称为基础备份。

在pg中可以由两种方法获取基础备份:

  • 使用系统low-level函数:pg_start_backup、pg_stop_backup以及一些shell命令(如cp、tar、rsync等)。

  • 使用pg_basebackup工具

3、pg_start_backup做了什么?

pg_start_backup和pg_stop_backup命令定义见这里:

src/backend/access/transam/xlogfuncs.c 

链接:https://github.com/postgres/postgres/blob/master/src/backend/access/transam/xlogfuncs.c

pg_start_backup()是一个用来启动基本备份的函数。它是PostgreSQL 8.0中引入的原始物理备份API的一部分。

pg_start_backup主要执行以下几个操作:

  • 强制服务器进入全页写模式(即使你设置了full_page_writes=off)。

  • 执行checkpoint(我在前面checkpoint的文章中提过,数据库恢复的过程需要从一个REDO位置开始,所以pg_start_backup需要做checkpoint来创建一个REDO点)。

  • 创建一个backup_label文件。

  • 这时候可以用以下命令查询

postgres=# select pg_is_in_backup();
 pg_is_in_backup
-----------------
 t
(1 行)

备考:

pg_is_in_backup()boolTrue if an on-line exclusive backup is still in progress.

4、backup_label文件的内容和作用什么?

一个backup_label示例:

START WAL LOCATION: 0/9000028 (file 000000010000000000000009)CHECKPOINT LOCATION: 0/9000060BACKUP METHOD: pg_start_backupBACKUP FROM: masterSTART TIME: 2021-5-10 11:45:19 GMTLABEL: Weekly Backup
  • 1.

其中:

CHECKPOINT LOCATION: 这是该函数创建的检查点被记录的LSN位置。当使用这个基础备份恢复数据库时,PostgreSQL从backup_label文件中获取“CHECKPOINT LOCATION”,并开始恢复过程。

BACKUP METHOD: 标示用于进行基础备份的方法(pg_start_backup或pg_basebackup)。

START TIME: 执行pg_start_backup时的时间戳。

LABEL: 这是在调用pg_start_backup(LABEL)中指定的标签。

5、此时你可能有疑问,为什么checkpoint的检查点的位置保存在了backup_label,而不是我们已知的pg_control里?

因为数据库的备份时间可能很长的,期间可能会多次执行常规checkpoint,如果放在pg_control里,那这个位置就可能会被常规checkpoint覆盖了。

6、pg_stop_backup做了什么?

pg_stop_backup主要完成以下工作:

  • 如果pg_start_backup强制打开了full_page_write,pg_stop_backup将会将其重置为非全页写模式。

  • 创建备份历史文件(timeline.hostory)。

  • 删除backup_label文件。(注:从基础备份恢复时,需要backup_label文件,其被复制到归档目录之后,在原始数据库集中就不再需要了。)

  • 这时候可以用以下命令查询

postgres=# select pg_is_in_backup();
 pg_is_in_backup
-----------------
 f
(1 行)

7、什么是数据库归档?

一般情况下,PostgreSQL数据库将wal文件保存在$PGDATA的pg_wal下。但是这些wal文件可能会被回收。为了避免这种情况,我们可以将wal文件的副本保存在除$PGDATA之外的单独目录中。在PG中,将wal文件复制到其他位置被称为归档(让服务器读取wal文件并应用它称为恢复)。

8、怎么开启归档?

在pg中开启归档,依赖三个配置:archive_mode、archive_command和wal_level

  • archive_mode:表示是否要启用wal归档。

  • archive_command:指定如何归档。此选项接受shell命令或shell脚本。

  • wal_level:可选项:

    • Minimal:只添加崩溃服务或立即关闭所需的信息。它不能用于复制或归档目的。

    • Replica: 表示wal将有足够的信息用于wal归档和复制。

    • Logical:添加逻辑复制所需的信息。

            

一个配置示例:

archive_mode = onarchive_command = ‘cp %p /path/to//archive_dir/%f’wal_level = replica
  • 1.

其中:

%p: 被替换为WAL文件的路径名。

%f: 被替换为WAL文件的文件名。

9、怎么做PITR(按时间点恢复)?

PITR工作需要两个重要的先决条件:

  • 基础备份的可用性。

  • 连续归档日志。

有了这两个为前提,然后需要配置restore_command和recovery_target选项。

示例:

# Place archive logs under /mnt/server/archivedir directory.restore_command = 'cp /mnt/server/archivedir/%f %p'recovery_target_time = "2021-5-10 12:05 GMT"
  • 1.

restore_command:指定从何处查找要在该服务器上重播的WAL文件。这个命令接受与archive_command相同的占位符。

recovery_target_time:该选项告诉服务器何时停止恢复或重放进程。一旦到达给定的时间戳,进程就会停止。

注:pg11.0以及之前,这两个参数在recovery.conf中进行设置。pg12.0以及之后在postgresql.conf中进行配置(12.0已经废除了recovery.conf,所有与recovery相关的参数都移到了postgresql.conf中)。除此之后,在版本12或更高版本中,当进行恢复时,还需要创建一个名为recovery.signal的空文件。

10、PITR的工作流程?

(1)PostgreSQL从backup_label文件中读取CHECKPOINT LOCATION的值,即REDO点。

(2) PostgreSQL从recovery.conf(版本11或更早)或PostgreSQL .conf(版本12或更高)中读取restore_command和recovery_target_time参数值。

(3) PostgreSQL从REDO点开始重放WAL数据,通过参数resotere_command,从归档日志中读取WAL数据,将归档日志从归档区复制到临时区。(临时区域中复制的日志文件使用后会被删除。)

注:如果没有配置recovery_target_time,PG将重放日志直到归档结束。

(4)恢复过程结束后,生成时间线历史文件,如00000002.History,该文件被创建在pg_xlog子目录(在版本10或更高版本,pg_wal子目录),如果启用了归档日志特性,归档目录下也会创建相同的命名文件。

11、PITR与正常的数据库恢复有何不同?

正常恢复模式是从base目录下的pg_wal目录中获取wal文件,而PITR模式是从archive_command中设置的归档目录中获取。

正常恢复模式从pg_control文件获取检查点位置,而PITR模式从backup_label文件中获取检查点位置。

12、什么是时间线?什么时间线历史文件?

PG中的时间线用于区分原始的数据库集群和恢复后的数据库集群,是PITR的核心概念。

每个数据库集群分配一个单独的timelineId。initdb实用程序创建的原始数据库集群的timelineId为1。当数据库集群恢复时,timelineId将增加1。

当我们启动PostgreSQL服务器时,初始时间线被设置为1,从pg_start_backup创建的REDO点到恢复目标,在归档日志中回放WAL数据,然后,一个新的timelineId 2被分配给恢复的数据库集,PostgreSQL将在新的时间线2上运行。如下图所示:

PostgreSQL之PITR_java

图片来源:https://www.interdb.jp/pg/pgsql10.html

前面提到,当一个PITR进程完成时,会生时间线历史文件。这个文件的命名规则为:

“8位的新timelineid.history”,比如此例中,就是00000002.history。

该文件的内容:

postgres> cat /home/postgres/archivelogs/00000002.history1    0/A000198  before 2021-5-10 12:05:00.861324+00
  • 1.

第一列:timelineId—timelineId用于恢复的归档日志的id。

第二列:LSN WAL段发生切换的位置。

https://mp.weixin.qq.com/s/dMfRn9kRosT-aOLm5jnHEw

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值