DG故障导致的主库归档无法自动删除导致主库磁盘空间耗尽数据库无法连接
前言
客户反映数据库应用无法使用,plsql无法连接数据库,报错提示没有空间存放归档。这个问题是比较常见的一个问题,也比较容易处理,既然常见,我这边为什么要记录呢?因为导致归档空间无法删除的原因很有趣。
一、故障排查
我登录服务器查看磁盘空间发现/oracle目录(数据文件和归档均在此目录下)使用率已经到100%,所以无法继续归档。原因找到了,那就先把故障处理掉,让下面业务恢复再说。常规步骤肯定是rman里面delete noprompt删除掉过期归档,但是执行命令后返回有报错:
报错提示删除不掉归档,原因是备库还没有应用。同时查看oracle下的定时任务,定时任务中配置了归档的定期删除。那就表明是dg故障了导致主库无法删除掉过期归档。然后我就登录dg服务器,发现dg服务器磁盘空间也满了,同样也是大量很久之前的归档没有删除导致磁盘空间满了,oracle下定时任务中也配置了归档的定期删除。用delete noprompt删除归档居然返回的报错和主库一样,奇了怪了,这本身就是dg备库,它的日志会传到哪去呢?查看相关参数发现dg备库居然被设置了如下参数:
二、解决问题
1.恢复主库业务
操作系统中删除部分归档
或者rman 中强制删除归档(可写入定时任务)
DELETE noprompt force ARCHIVELOG ALL COMPLETED BEFORE 'SYSDATE-2';
2.避免DG再次故障
将归档传递参数置为空
alter system set log_archive_dest_2='';