十一到了,每年这个时候很多企业都会做停电维护,供电设备的维修保养以及更换,今年也不例外,在接到十一停电通知后,要做好准备工作。我们提前3天跟后勤的工程主管沟通,询问停电的具体时间和范围,确定对机房断电的时间,这样我们好发邮件通知大家,这封邮件要提前发给大家,告知服务器中断服务的时间,这个时间段相关的IT应用服务都会受到影响,包括邮件等,这样大家都能够提前做好准备,安排工作,尤其是企业的高层会很重视这点,他们会考虑带来多少损失,我们的工作要做到前面。<?xml:namespace prefix = o ns = "urn:schemas-microsoft-com:office:office" />

 

接下来是工作的安排,由于十一放假大家都休息,因此要确认哪些应用的服务器中断会造成影响,比如说域控服务器、邮件服务器、DHCP服务器、虚拟机等等,是否需要提前一天做好数据备份,这些情况都是要逐个去落实,很有可能有的老服务器关机后无法启动,我们的UPSAPC,可以支持远程电源管理,能够赶在停电前对服务器执行关闭电源操作,这样我们可以使用×××去关闭这些服务器设备。至于门禁消防这块涉及到安全,需要安保人员加强停电期间的巡视,防止有意外情况的发生。

 

我们在30号开会讨论了停电的安排,具体到台式电脑都要在下班前关机,长时间的停电可以做一些日常很难去做的工作,比如UPS测试,看一看能够维持多长时间,联系供应商更换电池,还有比较老的D-LINK交换机也可以更换,工作就是抓住时机去做,不能老等着,天时、地利、人和都具备的情况很少,我们要一起去想能够完成的工作,这样才能让管理更上一个台阶。十一这天,我们到公司之后,将机房的开关都关闭,先检查一下UPS的放电状态,对各个节点机房都检查一遍,看看UPS的放电情况,对于有问题的做好记录,以备日后更换,凡是涉及到IT的网络设备相关的都要去检查一遍,我们利用这次停电,可以对UPS的状态做一个很好的测试,然后关闭UPS

 

等到来电10分钟后,打开机房开关,开启UPS电源,依次开启网络设备,确定这些设备正常供电之后,再开启域控服务器、邮件服务器等应用服务器,从KVM上切换显示到这些服务器的登录界面,使用笔记本获得IP地址之后,PING一下这些服务器的IP地址,都能够正常PING通之后,打开邮件,给自己发送一封测试邮件来检查一下。我们在十一的工作就是让IT的所有业务都恢复到停电前的状态,因此巡视一遍很有必要,不过不要忘记做好记录,对这次停电要有一份详细的文档记录,我们管理机房就要有完整的REPORT