使用场景:
1、客户计划内外停电;
2、机房搬迁;
3、故障设备更换或处理重大BUG(较少)
4、设备老旧下线;
方式方法为:
由于Exadata数据库一体机上运行的是Oracle GI集群系统和Oracle RAC数据库,所以有严格的开关机顺序:
一、系统开机:
1、为机柜加电
打开PDU开关进行加电(有两个PDU,不存在先后顺序),加电后:
1 )db服务器、cell服务器的SP(service processor)自动加电:指示灯都变绿,慢闪;
2)cisco交换机、Infiniband或RoCE交换机自动加电开机;
2、依次启动cell服务器(存储服务器,这里没有先后顺序,1/8和1/4都是3个节点)
按住其面板开关5秒(或者使用ilom的命令行方式进行开机)。
3、待所有cell服务器完全启动后再依次启动db服务器(数据库服务器,操作系统能登录或者ping通在或者MS等进程拉起)
按住其面板开关5秒。
4、启动其他数据库、应用等。
#crsctl start cluster -all
#srvctl start database -d xxxx -->手动关闭后需执行
#5分钟后检查集群状态crsctl stat res -t
集群资源状态正常后,通知业务部门进行数据库联通测试。
上面2、3步也可以也可在ILOM进行。
注意:启动顺序先cell server后DB server。
二、系统关机(提前发布停机通知,job=0,待应用程序关闭完成无运行事务后执行):
1、关闭DB服务器:
1)ssh到DB服务器(管理网登录)
2)关闭oracle数据库
#su - oracle
#srvctl stop database -d xxx(关闭之前可做检查点或者进行日志切换)
3)关闭集群 Clusterware
# /u01/app/grid/bin/crsctl stop cluster -all
3)关闭所有DB节点(1/8和1/4配置有两个DB节点)
# shutdown -h now
2、关闭所有cell服务器(1/8和1/4配置有三个CELL节点):
1)ssh cell服务器
2)执行命令# shutdown -h now
关闭cell节点时,所有存储相关服务会自动停掉;
3、关闭PDU开关;
此时可以拔掉电源,再进行相关操作。
注意:
1)如果需要关闭一个以上的cell节点,则需要停止所有数据库和clusterware;
2)只关闭一个cell节点不会影响到正在运行的数据库进程或ASM;
3) 关闭顺序先db server后cell server。