利用存储系统恢复服务器系统.
利用存储系统恢复服务器系统 摘要:在安装RAID5 的单服务器的工作环境中,迅速安全地恢复崩溃的操作系统是十分必要的。利用存储系统恢复崩溃的操作系统和业务数据库,是一种安全可行、用时最少的恢复方法
关键词:服务器故障;存储系统;备份;恢复
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)25-0195-02
Abstract:In the work environment of the single server installed RAID5, it is very necessary to quickly and safely restore the operating system. It is a safe and feasible method to use storage systems to restore a crashed operating system and business database.
Key words:server fault;storage system;backup restore
在信息化的时代,服务器的正常运转是至关重要的,一旦出现故障,将导致应用系统停止运行,业务停办。因此,运维人员如何在最短时间内采取最优方法,安全地将服务器系统恢复正常,并将应用系统恢复运转,把业务停办的不良影响减小到最小程度,是十分关键的
某日早上8点,体检中心来电反映多个体检工作点不能使用从业人员体检系统,体检大厅聚集了300多人,客户怨言很多,要求我部门立刻解决故障。刻不容缓,笔者马上进行故障排查
1 设备参数及工作环境
本单位的服务器是IBM X460,安装有IBM serverraid-8iRAID卡,并做了RAID5,操作系统是windows 2000 server,数据库系统是SQL 2000,数据库是从业人员体检数据库,有全市4万多从业 人员的数据;存储系统是爱数PX1200,该存储系统基于CDP持续数据保护技术,支持Windows平台下的SQL Server及支持完整的RAID 级别的实时复制
IBM服务器和爱数存储系统在本单位局域网中同处于一个VLAN中,同一个网段。IBM服务器的IP是192.168.0.27(以下称为27服务器),爱数存储系统的IP是192.168.0.253,网关都是192.168.0.254
2 故障原因分析
首先到一个体检工作点检查,发现确实不能登录系统,然后ping 27服务器,网络链路是通的;随后又检查了两个工作点,情况一样。因此断定网络链路没有问题,应该是27服务器出故障,于是回到机房检查,发现27服务器居然是关机状态。问了后勤部门,才知前一天晚上长时间停电,今早6点才恢复供电。笔者估计,单位的在线式UPS一定是有问题了,不能在停电的时候供电给27服务器,致使27服务器关机了。UPS的问题先不处理,当务之急是在最短的时间内安全地把27服务器恢复正常。于是打开27服务器,谁知系统蓝屏,不能进入windows 2000 server!重新启动27服务器两次都是如此。笔者断定,应该是由于突然停电造成windows 2000 server的系统文件损坏,导致不能正常进入系统
3 故障恢复方案的选择
1)一般的系统软故障恢复
在一般情况下,对于系统产生的软性故障, 在开机时按F8快捷键,在BIOS后就会有安全模式等系统选项,其中就有windows最后一次正确配置。选择后等待加载完成后,可正常进入系统。但这次试了两次都不能恢复系统 ,而且不能进入安全模式,再次证明windows 2000 server的系统文件损坏了,因此必须选择其他方式恢复了
2)GHOST恢复
对于一般的微机故障,可以用GHOST迅速地恢复系统,但服务器就不一定能由GHOST恢复系统。由于本单位的27服务器安装了IBM serverraid-8iRAID卡,并建立了RAID5, GHOST在DOS下无法加载阵列卡驱动,无法识别阵列卡,因此不能用GHOST软件做27服务器操作系统的备份和恢复
3)重装系统
重新用Wwindwos 2000 server安装盘安装操作系统肯定是可以解决故障的,但在安装过程中必须解决IBM serverraid-8iRAID卡的驱动问题。由于单位搬家,RAID卡的驱动找不见了,在IBM官网也找不到;之前第一次安装windwos2000 server时,用NLITE制作的整合了RAID卡驱动的windwos 2000 server盘也找不到了。即使找到那张安装光碟,重新安装完操作系统后,还要安装SQL,部署应用系统。整个过程估计要一个工作日才能完成。