问题:
测试环境有一套dataguard产生了过大的archive gap, dg链路不正常同步已经有几个月时间。
查询v$archive_gap 记录较多,而且根据最早的缺失日志去源端查询,发现由于时间已久,源端对应的归档日志已不存在(归档删除策略是只保留一天)。
处理方式:
由于归档文件缺失过多,源端也缺少部分历史归档文件,故只能采取增量恢复方式或者重新搭建dg备库了,相比较还是前者较为方便,毕竟主库还是在持续运行。
主库的switchover_status已经是 unresolvable gap
处理过程:
1、备库取消应用日志
alter database recover managed standby database cancel;
2、查询备库当前scn
select current_scn from v$database;
337410166259
3、主库创建基于备库scn的增量备份,并传到备库
RMAN> run {
allocate channel c1 device type disk;
allocate channel c2 device type disk;
backup incremental from scn 337410166259 database format '/backup/scn_bak_20171220/ora_scn_%U.bak';
release channel c1;
release channel c2;
}
scp ora_scn* root@xxxx:/data/baktmp/
4、备库修改文件属性
chown oracle:oinstall ora_scn*
5、备库重启到mount状态
shutdown immediate
startup mount
6、备库使用rman注册存放归档文件的目录,并恢复
RMAN> CATALOG START WITH '/data/baktmp';
RMAN> recover database noredo;
。。。。
。。。。
channel ORA_DISK_1: restored backup piece 1
channel ORA_DISK_1: restore complete, elapsed time: 00:09:05
Finished recover at 20-DEC-17
RMAN> exit
7、增量恢复完成后,暂时不要重启备库,
需要先从主库备份控制文件并传输到备库。
RMAN> BACKUP CURRENT CONTROLFILE FOR STANDBY FORMAT '/backup/scn_bak_20171220/ctl_20171220.bak';
scp ctl_20171220* root@xxxx:/data/baktmp/
8、备库修改control file权限,并重启到nomount状态,恢复控制文件
chown oracle:oinstall ctl_20171220*
SQL> shutdown immediate
SQL> startup nomount;
RMAN> RESTORE STANDBY CONTROLFILE FROM '/data/baktmp/ctl_20171220.bak';
9、mount备库,如果没有使用standby log,需要清空日志组,这里使用了standby log
SQL> alter database mount;
Database altered.
select * from v$logfile where type='STANDBY';
10、应用日志恢复
SQL> ALTER DATABASE RECOVER MANAGED STANDBY DATABASE USING CURRENT LOGFILE DISCONNECT FROM SESSION;
Database altered.
11、主库切换两次日志,看是否进行同步,验证同步状态
SQL> select max(sequence#) from v$archived_log;
MAX(SEQUENCE#)
--------------
2104
SQL> select * from v$archive_gap;
no rows selected
SQL> select OPEN_MODE from v$database;
OPEN_MODE
----------------------------------------
MOUNTED
12、重新开启日志恢复,打开数据库到只读状态
SQL> alter database recover managed standby database cancel;
Database altered.
SQL> alter database open read only;
Database altered.
SQL> alter database recover managed standby database using current logfile disconnect from session;
Database altered.
13、alert日志中产生部分报错:
ORA-01122: 数据库文件 205 验证失败
ORA-01110: 数据文件 205: '+TEMPFILE/arc_temp.407.890129425'
ORA-01565: 标识文件 '+TEMPFILE/arc_temp.407.890129425' 时出错
ORA-17503: ksfdopn: 2 未能打开文件 +/TEMPFILE/arc_temp.407.890129425
ORA-15001: 磁盘组 "+" 不存在或尚未装载
由于主库是rac系统,恢复过来的control file 记录的tempfile信息不对,需要重新创建所有的临时文件
SQL> alter database tempfile '+/TEMPFILE/temp.263.887472895' drop;
Database altered
SQL> alter tablespace temp add tempfile '/data/tempfile/temp02' size 1g;
Tablespace altered
至此,恢复完成