网络管理中十大常见错误!!~~[转]

网络管理中十大常见错误
——又应该怎样避免……
作者: Dirk A.D. Smith
(刊载于Network World, 06/09/03)
翻译:赵成栋[/center]
    你的工作是要维护网络的正常运行,这样其他的工作人员才能不受干扰的工作,这样你就可以在一个可以接受的时间里回到家。问题是事情并不是总是像你希望的那样;还是有些时候会出一些令人不快的麻烦。可能有很多原因,但现在我们仅关注网络管理中十个最常碰到的“陷阱”。
1. 使用不能连续工作的UPS
一家商店正榨干它的信息系统的最后一滴血。老服务器很难跟上商店发展的需要了,但是管理人员甚至不愿更新他们UPS的电池——其实这些电池早在多年前就该更换了。
一天,商店停电了,UPS老化的甚至来不及控制服务器系统安全地切掉电源关机。电池老化的蓄不了多少电,因此很快也就耗尽了。结果RAID控制器失效,引发服务器宕机。
这家商店可是百分之百的依靠这台服务器来进行日常的业务。最后,花了3天才恢复了服务器,又花了更长的时间来挽回损失。你要知道,一个售价仅75美元的电池就可以完全避免这个灾难的发生。
2. 没有打包好的工具包
一个电话打进公司总部,报告说某个办事处的服务器宕机了。网络管理员立即到现场去帮忙解决。驾车一个小时赶到目的地,跑进机房,马上投入解决问题。他发现操作系统已经崩溃,需要重新安装操作系统。办事处的网络管理员却无论如何找不到系统的安装光盘了!没问题,赶来的网络管理员恰好有一份可以用,不过是在他总部的办公室里——需要2个小时的往返时间。
打包好一个自己的工具包,放到门后(或者你的车里),那里面有你可能需要的所有东西,从各种操作系统的拷贝,到管线带,统统放在里面。这做起来并不麻烦,也花不了多少时间,但是在你要更新操作系统的时候就大有作为了。

3. 忘记打补丁
一家玩具制造商的服务器存在着文件连接的问题,一度导致公司的员工不能进行任何文件的访问,而且制造工作因此停了两天。造成的损失更是无比惨重。新招聘来的网络管理员着手解决这个问题。他很快发现以前的网络管理员自从3年前服务器安装以来就从来没有给系统安装过任何补丁。其实,这个问题两年前就已经发现,只要安装一个补丁就能解决。
补丁包一般是免费的。可能它们有点儿“笨”,但是它们是非常容易安装实施的。任何一个系统管理员都能够胜任打补丁的工作。显然,离任的管理员认为因为系统运行的很好,没有必要打补丁。
4. 坏的“正确数据”备份
医疗机构办公室保存医疗文档和病人病例的服务器瘫了。由于无法访问任何信息数据,所有的工作都被迫停止。网络管理员立即拿了一个最近“正确数据”的备份去恢复。当她发现磁带是空白时,她的心全凉了。她又检查了剩下的磁带:全是空白!
她翻阅了办公室的工作日志,发现她的员工两年来一直每天更换磁带,但是磁带都是被放进一个没有备份软件的服务器里——从来就没有人加载过那个软件。磁带机甚至就没有连好。没有人知道备份徒劳无益,因为他们就从没检查过,也从来没有做过恢复的测试。他们只是换了两年的空白磁带。
忙活了两天后,她终于恢复了数据库的运行,但是办公室损失了大笔的钱。任何联机数据库的管理员都能够轻易的避免类似问题的发生,只要一个简单的备份检查就可以了。现在他们已经这么做了:每天检查。
5.雇佣不合格的配线工
一家银行的网络经常崩溃。检查电话机柜,发现各种大小、形状、长度的线缆互相纠缠在一起,就像一个鸟巢。而且,配线工把RJ-11和RJ-12的电话线都插进了RJ-45的接线口里。不但接线有问题,而且它们还常常掉出来。为了改变这种情况,接线工把牙签塞进接线口里来保证接线器呆在原地不动。
很多网络问题都源自不合格的接线。确信你请了一个合格的配线工安装了所有的线缆。
6. 没有掀起盖子做检查
一个职业运动队买了一台高端的名牌服务器,但是从一开始就有问题。网络管理员向操作系统厂商和硬件厂商求助。结果发现是销售商在名牌服务器中安装了没有牌子的内存和硬盘控制器,连外挂的磁盘驱动器也是无名厂商生产的——仅仅因为这些部件便宜一些。
硬件厂商和操作系统厂商都拒绝提供技术支持,因为这台服务器使用了非该品牌的部件,而且配置也不是厂家认可的。你的网络操作系统厂商仅仅承诺为那些经过认证、测试的服务器提供支持服务——这些服务器是作为一个整体,而不是一堆部件的集合接受出厂测试的。
7. 在保修合同上省钱
去年一个办事处花了一大笔钱买了第一台容错服务器。这个系统有一个RAID5磁盘阵列、双电源和24×7的技术支持。一年后,一个驱动器出了问题。
负责27×7支持人员赶到现场。他打电话给硬件厂商,对方要求提供保修证书的编号。而这个办事处并没有购买保修服务。“没问题”,厂商说,“还要两年的出厂保修期,因此可以在5、6天内给你一个替换的驱动器”
看来,容错还不够。确信你有一个完整的现场24×7技术支持服务,然后到办公用品商店买一些标签。标签上写清楚保修号码、技术支持服务电话,并一一贴到相应的机器上。
8. 不使用一个测试环境
几年前,一个软件开发公司安装了一台新的工作站,配置了内存、硬盘和最快的处理器。那是给总裁的新机器。安装后不久,他接受了他的一个最大的合作伙伴提出的进行新型卫星通信系统主板测试的请求。结果是机器出现蓝屏。惊讶之后,他重启了机器,情况照旧。重新安装系统后,用了4天的时间才把操作指南找个差不多。
另外一家公司,由另一个有更多这方面知识的总裁来运营,他专门建立了一个测试网络。在进行补丁升级之前,他们会在测试网络上进行试验。这个过程中,他们可能发现一些问题,重置网络再试验。这样反复不停的试,直到没有问题为止。对所有的操作进行记录后,他们才会在正式的网络中实施升级。
显然,第一家公司的老板永远不会在他自己的机器上进行任何的试验了。

9. 做容量规划
五年前,当一家戏剧艺术公司购买一台新服务器的时候,它能够配置6个8GB的RAID5磁盘阵列。为了省钱,公司坚持采用了4个4GB的磁盘。网络管理员曾经提出建议,说他们以后会需要更多的磁盘空间。精于算计的负责人终于妥协,增加了两个额外的驱动器,占满了整个机架。
3年后,他们耗尽了所有的存储空间,甚至最后他们要删除50k大小的文件来挤空间。他们开始需要新的磁盘。但是,8G的磁盘已经不再制造了,这台服务器也不支持更大的磁盘。一个外挂的子系统甚至比这台服务器花的钱还要多。最后,只好提前两年换掉了服务器。
容量规划就是要买比你现在的需要更多的硬件,包括更多的磁盘空间、内存和处理器运算能力。只有这样,你才可能在你的服务器用到一半年限的时候不出现难以升级的问题。这种预先的规划会增加约10%的支出。比起一个新的系统或者升级时出现的严重问题,这10%的预支费用还是值得的。
10. 最可怕的因素:用户
办公室的电源在下午的晚些时候中断了。紧张的办公室经理知道会对他们的两台服务器造成影响,因此他立即采取了措施。他过去关掉了服务器。怀着对自己及时对瘫痪的网络采取行动的自信,回家了。
第二天早上,他回到办公室,打开那两台服务器,什么也看不到。
其实,当他按下电源按钮的时候,服务器正在对一些重要的文件进行复杂的更新处理。他把一台的启动磁盘搞坏了,而另外一台运行着非常重要数据库的服务器的磁盘组也被破坏了。花了两天的时间才修复这个网络。
在所有的问题中,给网络管理员带来最多麻烦的,一定是那些从地狱里来的用户了。要让你的网络免于各种问题的困扰,最难以防备的就是这些人了。