数据库异常关闭后无法启动问题处理一例

某系统突然掉电,系统启动后发现Oracle无法启动。启动时报如下错误:
    ORA-01102 cannot mount database in EXCLUSIVE mode

出现1102错误可能有以下几种可能:
    一、在HA系统中,已经有其他节点启动了实例,将双机共享的资源(如磁盘阵列上的裸设备)占用了;
    二、说明Oracle被异常关闭时,有资源没有被释放,一般有以下几种可能,
        1、 Oracle的共享内存段或信号量没有被释放;
        2、 Oracle的后台进程(如SMON、PMON、DBWn等)没有被关闭;
        3、 用于锁内存的文件lk和sgadef.dbf文件没有被删除。   

首先,虽然我们的系统是HA系统,但是备节点的实例始终处在关闭状态,这点通过在备节点上查数据库状态可以证实。
其次、是因系统掉电引起数据库宕机的,系统在接电后被重启,因此我们排除了第二种可能种的1、2点。
最可疑的就是第3点了。

查$ORACLE_HOME/dbs目录:
     $ cd $ORACLE_HOME/dbs
     $ ls sgadef*
     sgadef* not found
     $ ls lk*
     lkORA92
    
果然,lk文件没有被删除。将它删除掉
     $ rm lk*
    
再启动数据库,成功。

如果怀疑是共享内存没有被释放,可以用以下命令查看:
     $ipcs -mop
     IPC status from /dev/kmem as of Thu Jul  6 14:41:43 2006
     T      ID     KEY        MODE        OWNER     GROUP NATTCH  CPID  LPID
     Shared Memory:
     m       0 0x411c29d6 --rw-rw-rw-      root      root      0   899   899
     m       1 0x4e0c0002 --rw-rw-rw-      root      root      2   899   901
     m       2 0x4120007a --rw-rw-rw-      root      root      2   899   901
     m  458755 0x0c6629c9 --rw-r-----      root       sys      2  9113 17065
     m       4 0x06347849 --rw-rw-rw-      root      root      1  1661  9150
     m   65541 0xffffffff --rw-r--r--      root      root      0  1659  1659
     m  524294 0x5e100011 --rw-------      root      root      1  1811  1811
     m  851975 0x5fe48aa4 --rw-r-----    oracle  oinstall     66  2017 25076

然后它ID号清除共享内存段:
    $ipcrm –m 851975

对于信号量,可以用以下命令查看:
    $ ipcs -sop
    IPC status from /dev/kmem as of Thu Jul  6 14:44:16 2006
    T      ID     KEY        MODE        OWNER     GROUP
    Semaphores:
    s       0 0x4f1c0139 --ra-------      root      root
    ... ...
    s      14 0x6c200ad8 --ra-ra-ra-      root      root
    s      15 0x6d200ad8 --ra-ra-ra-      root      root
    s      16 0x6f200ad8 --ra-ra-ra-      root      root
    s      17 0xffffffff --ra-r--r--      root      root
    s      18 0x410c05c7 --ra-ra-ra-      root      root
    s      19 0x00446f6e --ra-r--r--      root      root
    s      20 0x00446f6d --ra-r--r--      root      root
    s      21 0x00000001 --ra-ra-ra-      root      root
    s   45078 0x67e72b58 --ra-r-----    oracle  oinstall
 
根据信号量ID,用以下命令清除信号量:             
    $ipcrm -s 45078
 
如果是Oracle进程没有关闭,用以下命令查出存在的oracle进程:
    $ ps -ef|grep ora
      oracle 29976     1  0  Jun 22  ?         0:52 ora_dbw0_ora92
      oracle 29978     1  0  Jun 22  ?         0:51 ora_dbw1_ora92
      oracle  5128     1  0  Jul  5  ?         0:00 oracleora92 (LOCAL=NO)
    ... ...
 
然后用kill -9命令杀掉进程
    $kill -9
 
总结:当发生1102错误时,可以按照以下流程检查、排错:

如果是HA系统,检查其他节点是否已经启动实例;
检查Oracle进程是否存在,如果存在则杀掉进程;
检查信号量是否存在,如果存在,则清除信号量;
检查共享内存段是否存在,如果存在,则清除共享内存段;
检查锁内存文件lk和sgadef.dbf是否存在,如果存在,则删除。

文章出自:http://www.hellodba.com/cases/case-unexception_down.htm

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/11134237/viewspace-660618/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/11134237/viewspace-660618/

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值