一次数据文件误删除故障案例分享

一、案例概述

 

某医疗机构在进行例行数据库维护时,意外地在 `SYSTEM` 表空间添加了一个新的数据文件。然而,操作系统管理员将此新增的 `SYSTEM` 数据文件删除,致使数据库宕机。由于该数据库处于非归档模式,数据恢复变得更加复杂和紧迫。

二、故障原因分析

 

`SYSTEM` 表空间是Oracle数据库中最为核心的表空间,所有数据文件必须处于 `ONLINE` 状态以确保数据库正常运行。然而,删除了新增的 `SYSTEM` 数据文件后,致使数据库无法正常打开,因为数据库需要所有的 `SYSTEM` 表空间数据文件来维持其一致性和完整性。

三、紧急处理方法

 

在接到故障 通知 后,我们迅速采取了一系列措施,成功恢复了数据库功能。以下是详细的恢复步骤:

1. 挂载数据库:

    首先,我们将数据库挂载,以便进行进一步的恢复操作。

   ```sql

   ALTER DATABASE MOUNT;

   ```

2. 创建缺失的数据文件:

    接着,我们使用 `ALTER DATABASE CREATE DATAFILE` 命令重新创建了丢失的 `SYSTEM` 数据文件。

   ```sql

   ALTER DATABASE CREATE DATAFILE 9;

   ```

3. 恢复数据文件:

    使用 `RECOVER DATAFILE` 命令对新的数据文件进行恢复操作。

   ```sql

   RECOVER DATAFILE 9;

   ```

4. 打开数据库:

    最后,通过 `ALTER DATABASE OPEN` 命令成功打开数据库。

   ```sql

   ALTER DATABASE OPEN;

   ```

成功恢复的原因

我们之所以能够成功恢复数据库,主要是因为从9号文件被创建到出现故障这段时间的 `REDO` 日志没有被覆盖。这意味着创建出的文件的 `SCN` 是正确的,数据文件中的内容也都完整无误。

 

四、内容扩展

 

在处理过程中,我们发现了两种复杂情况,这些情况需要不同的处理方法。

  问题一: `REDO` 日志有缺失

如果在故障发生期间,关键的 `REDO` 日志已经被覆盖,我们可以使用 `BBED` 工具对比其他文件的 `SCN` 以恢复数据文件。

  使用 `BBED` 工具进行恢复

`BBED`是一个强大的工具,可以直接编辑Oracle数据块。使用它可以恢复错误的 `SCN` 和 `DBA` 数据。

1. 设置 `DBA`:

   ```sql

   BBED> set dba 2,1

          DBA 0x00800001 (8388609 2,1)

   ```

2. 转储偏移量并提取 `SCN` 信息:

   ```sql

   BBED> dump offset 484 count 10

   File: /u01/app/oradata/localdb/sysaux01.dbf (2)

   Block: 1 Offsets: 484 to 493 Dba:0x00800001

   -------------------------------------------------------

   6dd15100 00007009 5c1a

   BBED> dump offset 500 count 10

   File: /u01/app/oradata/localdb/sysaux01.dbf (2)

   Block: 1 Offsets: 500 to 509 Dba:0x00800001

   -------------------------------------------------------

   d7000000 02000000 1000

   ```

3. 设置新的 `DBA` 并修改偏移量:

   ```sql

   BBED> set dba 9,1

          DBA 0x02400001 (37748737 9,1)

   BBED> m /x 6dd15100 offset 484

   Warning: contents of previous BIFILE will be lost. Proceed? (Y/N) Y

   File: /u01/app/oradata/localdb/system02.dbf (9)

   Block: 1 Offsets: 484 to 493 Dba:0x02400001

   -------------------------------------------------------

   6dd15100 00000000 4a15

   BBED> m /x d7 offset 500

   File: /u01/app/oradata/localdb/system02.dbf (9)

   Block: 1 Offsets: 500 to 509 Dba:0x02400001

   -------------------------------------------------------

   d7000000 02000000 0000

   ```

4. 应用校验:

   ```sql

   BBED> sum apply

   Check value for File 9, Block 1:

   current = 0x4bb6, required = 0x4bb6

   ```

通过以上步骤,我们成功恢复了丢失的 `SCN` 信息,使得数据文件能够再次被识别。

  问题二:新添加的数据文件中有对象创建

如果在故障 之前 ,有新对象在被删除的数据文件中创建,我们可以通过手动清理基表或使用 `DBMS_SPACE_ADMIN` 包进行恢复。

  手动清理基表

1. 删除 `tab$` 表中的记录:

   ```sql

   SQL> delete from tab$ where file=9;

   1 row deleted.

   ```

2. 删除 `seg$` 表中的记录:

   ```sql

   SQL> delete from seg$ where file=9;

   0 rows deleted.

   ```

3. 删除 `ind$` 表中的记录:

   ```sql

   SQL> delete from ind$ where file=9;

   1 row deleted.

   ```

4. 删除 `obj$` 表中的记录:

   ```sql

   SQL> delete from obj$ where owner=9;

   2 rows deleted.

   ```

5. 提交更改:

   ```sql

   SQL> commit;

   Commit complete.

   ```

  使用 `DBMS_SPACE_ADMIN` 包处理

1. 查询 `seg$` 表:

   ```sql

   SQL> select file,block,type,ts from seg$ where file=9;

   FILE     BLOCK      TYPE        TS

   ---------- ---------- ---------- ----------

   9         10          5          7

   9         18          6          7

   ```

2. 标记和删除损坏的段:

   ```sql

   exec dbms_space_admin.segment_corrupt('<TSNAME>', <FILE_ID>, <BLOCK_ID>, DBMS_SPACE_ADMIN.SEGMENT_MARK_CORRUPT);

   exec dbms_space_admin.segment_drop_corrupt('<TSNAME>', <FILE_ID>, <BLOCK_ID>);

   exec dbms_space_admin.tablespace_rebuild_bitmaps('<TSNAME>');

   ```

3. 重启数据库。

五、结论

通过上述详细的恢复步骤和解决方法,我们成功地解决了因为 `SYSTEM` 表空间数据文件删除引起的数据库故障问题。这次事件不仅展示了我们在处理紧急情况时的技术能力和应变能力,也强调了数据库维护过程中每一步操作的重要性。我们的经验表明,在面对数据库故障时,理解 `SCN` 和 `REDO` 日志的作用,灵活运用各种数据库管理工具,是确保数据完整性和快速恢复的关键。未来,我们将继续提升数据库管理和维护的能力,确保业务系统的稳定运行。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值