数据库异常关闭后无法启动问题处理一例
作者: fuyuncat
来源: www.HelloDBA.com
某系统突然掉电,系统启动后发现Oracle无法启动。启动时报如下错误:
出现1102错误可能有以下几种可能:
一、在HA系统中,已经有其他节点启动了实例,将双机共享的资源(如磁盘阵列上的裸设备)占用了;
二、说明Oracle被异常关闭时,有资源没有被释放,一般有以下几种可能,
1、 Oracle的共享内存段或信号量没有被释放;
2、 Oracle的后台进程(如SMON、PMON、DBWn等)没有被关闭;
3、 用于锁内存的文件lk和sgadef.dbf文件没有被删除。
首先,虽然我们的系统是HA系统,但是备节点的实例始终处在关闭状态,这点通过在备节点上查数据库状态可以证实。
其次、是因系统掉电引起数据库宕机的,系统在接电后被重启,因此我们排除了第二种可能种的1、2点。最可疑的就是第3点了。
查$ORACLE_HOME/dbs目录:
果然,lk文件没有被删除。将它删除掉
再启动数据库,成功。
如果怀疑是共享内存没有被释放,可以用以下命令查看:
然后它ID号清除共享内存段:
对于信号量,可以用以下命令查看:
根据信号量ID,用以下命令清除信号量:
如果是Oracle进程没有关闭,用以下命令查出存在的oracle进程:
然后用kill -9命令杀掉进程
总结:
当发生1102错误时,可以按照以下流程检查、排错:
- 如果是HA系统,检查其他节点是否已经启动实例;
- 检查Oracle进程是否存在,如果存在则杀掉进程;
- 检查信号量是否存在,如果存在,则清除信号量;
- 检查共享内存段是否存在,如果存在,则清除共享内存段;
- 检查锁内存文件lk和sgadef<sid>.dbf是否存在,如果存在,则删除。
http://www.hellodba.com/index.html 来源
[@more@]来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/21340813/viewspace-1029159/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/21340813/viewspace-1029159/