问题是如何变大的(系统崩溃指南)

呵。记最近系统管理中碰到一个情况。 

系统的环境是 多台服务器,两个大空调,温度监控系统,磁盘阵列。其中温度监控系统监控系统24小时工作,如果温度异常将直接拨打责任人电话。

系统一直运行良好直到有一天。。。

这一天磁盘阵列出现问题,直接影响到系统中的一个关键子系统。经检查发现是是控制器出现故障,为尽快恢复需要一台主机来重建磁盘阵列。因系统主机资源紧缺,所以经讨论动用了温度监控系统主机来进行这一处理。

第二天机房电源修理,暂时进行了断电。恢复供电后机房空调没有自动开机。

第三天机房全部服务器均自动关机,机房温度达到60。C。

嗯。万幸这次还没有出现大问题。

在系统管理中, 经常就是不出问题则没有人关心,就好像系统正常运行是天经地义的事情。

真正系统运行时不出现问题那几乎是不可能的情况,出现问题到不可怕,可怕的是管理系统的人对

于问题没有作好准备。

在美国9.11时,一个金融服务公司因大楼倒塌,相应信息系统全毁,这对于一个服务企业来说完全是

致命打击。可就这家公司不到几个月就全面恢复正常运营,这里的关键因素就是公司采用了远程备份

方式保全了公司的数据。

所以在系统管理中不应视系统应理所当然的7*24运行,应提前做好应急预案,做为备份。

以免出现问题时忙中出错,越忙越错的问题。

 

 

  • 0
    点赞
  • 0
    评论
  • 0
    收藏
  • 一键三连
    一键三连
  • 扫一扫,分享海报

©️2021 CSDN 皮肤主题: 大白 设计师:CSDN官方博客 返回首页
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值