ebs应用io错误不完全恢复

最新推荐文章于 2022-12-06 11:20:50 发布

congji3615

最新推荐文章于 2022-12-06 11:20:50 发布

阅读量243

点赞数

文章标签：数据库操作系统

本文记录了一次Oracle数据库遇到I/O错误后的恢复过程，包括使用RMAN验证数据文件、修复坏块、重建控制文件及利用备份归档日志进行不完全恢复的方法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

MicrosoftInternetExplorer402DocumentNotSpecified7.8Normal0

一：故障描述

ebs应用时候报i/o错，查看发现数据库处于mount状态，想open时又报错

SQL> alter database open;

alter database open

ERROR at line 1:

ORA-01115: IO error reading block from file 8 (block # 135129)

ORA-01110: data file 8: '/export/zones/zone02/root/dev_data/DEV/db/apps_st/data/system08.dbf'

ORA-27063: number of bytes read/written is incorrect

SVR4 Error: 5: I/O error

Additional information: -1

Additional information: 8192

通过rman检查是否有坏块

RMAN> BACKUP VALIDATE DATAFILE 8;

Starting backup at 17-OCT-12

using target database control file instead of recovery catalog

allocated channel: ORA_DISK_1

channel ORA_DISK_1: SID=651 device type=DISK

channel ORA_DISK_1: starting full datafile backup set

channel ORA_DISK_1: specifying datafile(s) in backup set

input datafile file number=00008 name=/export/zones/zone02/root/dev_data/DEV/db/apps_st/data/system08.dbf

RMAN-00571: ===========================================================

RMAN-00569: =============== ERROR MESSAGE STACK FOLLOWS ===============

RMAN-00571: ===========================================================

RMAN-03009: failure of backup command on ORA_DISK_1 channel at 10/17/2012 09:57:43

ORA-19501: read error on file "/export/zones/zone02/root/dev_data/DEV/db/apps_st/data/system08.dbf", block number 135040 (block size=8192)

ORA-27063: number of bytes read/written is incorrect

SVR4 Error: 5: I/O error

Additional information: -1

Additional information: 1048576

RMAN> blockrecover datafile 8 block 135040;

Starting recover at 17-OCT-12

using channel ORA_DISK_1

starting media recovery

media recovery complete, elapsed time: 00:00:00

Finished recover at 17-OCT-12

RMAN> list backup;

specification does not match any backup in the repository

RMAN>

RMAN> BACKUP VALIDATE DATAFILE 9;

Starting backup at 17-OCT-12

using channel ORA_DISK_1

channel ORA_DISK_1: starting full datafile backup set

channel ORA_DISK_1: specifying datafile(s) in backup set

input datafile file number=00009 name=/export/zones/zone02/root/dev_data/DEV/db/apps_st/data/system09.dbf

channel ORA_DISK_1: backup set complete, elapsed time: 00:00:25

List of Datafiles

=================

File Status Marked Corrupt Empty Blocks Blocks Examined High SCN

---- ------ -------------- ------------ --------------- ----------

9 OK 0 92701 209152 114648244

File Name: /export/zones/zone02/root/dev_data/DEV/db/apps_st/data/system09.dbf

Block Type Blocks Failing Blocks Processed

---------- -------------- ----------------

Data 0 77493

Index 0 36139

Other 0 2819

Finished backup at 17-OCT-12

RMAN> BACKUP VALIDATE DATAFILE 7;

Starting backup at 17-OCT-12

using channel ORA_DISK_1

channel ORA_DISK_1: starting full datafile backup set

channel ORA_DISK_1: specifying datafile(s) in backup set

input datafile file number=00007 name=/export/zones/zone02/root/dev_data/DEV/db/apps_st/data/system07.dbf

channel ORA_DISK_1: backup set complete, elapsed time: 00:00:15

List of Datafiles

=================

File Status Marked Corrupt Empty Blocks Blocks Examined High SCN

---- ------ -------------- ------------ --------------- ----------

7 OK 0 34 106112 114647296

File Name: /export/zones/zone02/root/dev_data/DEV/db/apps_st/data/system07.dbf

Block Type Blocks Failing Blocks Processed

---------- -------------- ----------------

Data 0 77742

Index 0 28228

Other 0 108

Finished backup at 17-OCT-12

RMAN>

通过对比，发现7、9号数据文件完好，而8号数据文件有问题，怀疑是8号文件所在的扇区出现了问题，又做了如下验证

-bash-3.2$ cp system08.dbf system08.dbf.new

cp: system08.dbf: I/O error

-bash-3.2$ cp system07.dbf system07.dbf.new

-bash-3.2$

通过cp确实验证了是操作系统扇区的问题，一般情况下，如果出现system.dbf文件损坏

可以将原来报错的文件拷贝到另一目录，名字不变，然后进行恢复。

二：数据库原始备份情况

数据库已经开启了归档模式，但是并没有做数据库的rman备份

SQL> archive log list;

Database log mode Archive Mode

Automatic archival Enabled

Archive destination /export/zones/zone02/root/dev_data/DEV/db/apps_st/archlog_dev

Oldest online log sequence 8

Next log sequence to archive 10

Current log sequence 10

SQL>

后来经过核查，发现保存了一份9月24日的DEV.tar包，归档日志文件从9月22日到10月16日都完好

三：数据库恢复步骤

1：备份原来DEV 目录下的归档日志文件

# mkdir archlog-bak

# su – oracle

$ cd /export/zones/zone02/root/dev_data/DEVold/db/apps_st/archlog_dev

$ cp ./* /archlog-bak

2：解压DEV.tar包

解压DEV.tar包前，先将DEV目录更改为DEV.OLD

# cd dev_data

# tar -xvf /EBS_DEV_20120924.tar

解压完成后，数据只能先启动到mount状态；因为tar出来的数据库是一个冷备，数据库三种文件的scn都一致，如果执行一个startup命令，数据库就可以直接open到9月24备份前的那个状态。本次恢复是采用最新的控制文件、利用旧的数据文件备份做不完全恢复。首先等tar解压完毕以后，将备份的归档日志拷贝到新解压的归档日志目录

3：将数据库启动到mount状态，找到控制文件创建语法

SQL> startup mount;

SQL> alter database backup controlfile to trace;

然后切换到trace文件所在的目录下，/dev_data/DEV/db/tech_st/11.2.0/admin/DEV_zone02/diag/rdbms/dev/DEV/trace

执行如下命令找到最新的以trc后缀结尾的文件

bash-3.2$ ls -lt |more

然后用more命令查看相关trc文件： DEV_ora_19797.trc

找到控制文件的创建语法，截取 Set #2. RESETLOGS case 中的语句，粘贴到ue工具中，去掉文字前的所有空格

（./符号前的空格必须去掉，临时文件可以不用创建），然后粘贴到/home/oracle/下的 ct.sh ，并赋予执行权限）

4：关闭数据库，备份原来的控制文件到 /home/oracle目录下，然后删除原来的控制文件，并将db启动到 nomount状态下，重建控制文件

SQL> shutdown immediate;

bash-3.2$ cd /export/zones/zone02/root/dev_data/DEV/db/apps_st/data/