故障发生症状:服务器操作系统是window 2000的,提供ERP服务与财务服务软件,里面安装有瑞星全系列安全软件(瑞星杀毒软件,瑞星防火墙,瑞星卡卡),刚进公司上班的时候,服务器不断出现死机,蓝屏(0x00000e10x00000D1,rfwtdi.sys文件之类。每天蓝屏三四次,有时更多。

 

解决问题思路和过程1:一开始,我根据经验我认为是内存问题,因为服务器配置两条金士顿512M内存,于是拔掉一条,问题还是一样,过几个小时继续同样的蓝屏代码!于是我换了单条1G内存,故障依旧。

2:进而我看了芯片组是nvida系列,CPUAMD速龙双核系列,作为服务器系统不是稳定的(比起INTEL芯片组),用手触摸CPU温度很高,但显卡芯片温度正常。过些天服务器依然蓝屏死机,而且出现直接死机也不重启了,蓝屏代码也不一样了,打开服务器发现CPU风扇已经转速变慢,几乎接近不转。换了CPU风扇,仍然有蓝屏现象,每天好几次,但是蓝屏的代码又跟以前的代码一样了(0x00000e1,0x00000d1,rfwtdisys)。

3:进公司时的蓝屏跟中途风扇坏了的蓝屏代码不一样,然后换了风扇后,蓝屏代码又跟进公司的代码一样,可以进一步诊断真正的故障原因还时只有一个:就是瑞星安全系列软件的驱动文件与系统冲突。

 

深入剖析:经查询rfwtdi.sys系瑞星安全软件系列的驱动文件,在系统升级以及安装时可能造成蓝屏死机,这个文件与系统冲突。基本上卸载可解决问题。

 

进阶测试:现阶段因为服务器在财务室,瑞星安全系统软件不同意卸载,所以一切测试有待确认。

 

总结:碰到一个问题,总有一个思路和过程,要透过现象去分析问题的本质,本次问题出现,表面是简单的蓝屏,其实涉及到深入分析故障的表象,以及深入到系统文件冲突,排除一些繁杂因素,最后确定出故障的真正原因。