服务器硬件故障排查手册
服务器硬件故障诊断手册
关于服务器的故障原因我们可以分为两大类,一种是硬件故障一种是软件故障。这里我们在这里先说说硬件故障的排查方法及步奏。
我们都知道服务器是由芯片组主板,处理器 即(CPU),内存,三大件组成,当然我们要利用服务器来完成我们的一些日常工作肯定少了不了数据盘。也就是硬盘。最后服务器也属于电子产品当然少不了电源了
从上面我们知道了服务器的主要部件,那么接下来我们就以我们日常所遇到的一些故障做一些描述。
我们平常遇到的一些故障,一般为:服务器点不亮。
以上这种故障很常见。这种故障主要的表现,当我们接上电源,芯片组主板,处理器和内存 通电显示器不显示,内存不会警报。
这种故障第一时间有很多人会第一时间认定为主板的问题。其实有一些细节我们可以进行排查的。先观察主板是否正常通电,CPU是否正常转动等。因为这两个细节可以判断电源和主板短路的可能。如果以上两个细节确定是正常的话,那么这张主板%99是正常可以点亮的。假如主板不能正常通电,主板上的LED指示灯不亮,那么我们就排查电源的环节了。假如主板正常通电,CPU的散热风扇,转动一下,停止一下的话,你就需要做以下操作进行排查,首先关掉电源断电,然后把主板上的电池扣下来进行主板放电,还原BIOS的一些信息,大概10秒的时间再把电池装上,电源打开,观察是否正常。做过此操作CPU散热依然是转动一下,停止一下的话,那么我们基本上可以定义为主板短路了。
一种是带警报声音,警报声音一般有内存警报,CPU警报,主板警报等。下面列一下比较常见的警报声音的特点给大家,希望在判断故障的时候对大家有所帮助
长声不断响,这种警报通常是内存未插紧,处理方法,建议重新插拔一下内存条
1长1短,通常是主板或内存警报,排查方法,建议把内存拔下来,观察主板还会不会警报,或者更换内存的方法排除到底是主板还是内存的警报
滴...滴...有间隔连续的长音,通常是内存啦的警报,一般为内存松动,内存接触不良,内存金手指氧化等。处理办法:找个橡皮擦,把内存金手指部分擦干净,再接上内存测试
滴...滴...连续的短音,一般为主机电源的问题,主机并不报警,但是会造成硬盘丢失,光驱的读盘性能慢,经常死机的情况,出现以上情况,最好检查一下各路的电压输出,是否偏低,当+5v和+12v低于%10时,就会不定时的出现上述问题,因为电源有电压输出,经常会误以为是主板问题或硬盘的问题,而浪费好多时间,造成电压偏低的原因是输出部分的滤波电容失容或漏液造成的,当直流成分降低时中频交流的成分加大,会干扰主板的正常工作,造成系统不稳定,容易出现死机或蓝屏的几现象。
不过这种情况在intel 技嘉和某类主板上出现“滴滴...的连续鸣叫,并不是电源的故障,而是内存故障,这一点需要注意
短促的滴的一声,一般情况下,这种是主板自检通过,系统正常启动的提示音,不过有的主板是没有提示音的,有的主板自检可能时间会比较长,会等5-6秒的时间才会响提示音,需要一点耐心
以上是我们遇到比较常见的故障,排查操作建议吧主板芯片拆到机箱外,用最少的内存,最少的处理器进行故障排查,用一些静电膜做好铺垫,防止造成短路,非专业人士不建议进行操作,以免造成不必要的误损。
上面我们介绍到主板芯片和内存电源的排查方法,下面我们说说硬盘的故障排查检测办法。磁盘故障也比较常见,因为磁盘是属于消耗品,随着使用的时间推移,磁盘的性能方面及寿命方面都会有所损耗。故障一般分为磁盘无法识别,磁盘坏道,无法读写,读写性能差。
首先说说读写性能方面。
先说说磁盘性能方面,我们需要先了解产品的各种出厂参数,比如读写速度,响应速度,容量等等。因为只有知道这些参数我们才能为我们测试磁盘时作为一个参考及对比,这样才能了解我们的磁盘是否存在故障,及性能误差的底线。
磁盘坏区,我们通常用一些软件测试,去了解内部结构是否存在故障,比如内部结构的某一个块区坏块,这种故障很致命,列如某个网吧的一个数据盘出现这种故障,下面的客户机会秒卡,严重的会造成客户机卡死,蓝屏等现象。企业级机械硬盘测试软件建议用HDDScan-V27,磁盘扫快软件,2T以上的企业级硬盘建议用HDDScan3.3版本。先介绍一些测试的软件版本。软件使用说明我们也会做一个详细的操作图解给大家进行参考。
磁盘性能方面,建议利用HD-speed,硬盘持续读写软件,进行长时间的读写测试对比参数来判断。当然磁盘性能是根据使用时间的推移会有所下降,这就需要了解你的磁盘使用的时间做一个损耗值加在里面进行参考对比了
固态硬盘方面,简称SSD,采用闪存作为存储介质,读写速度相对机械盘更快,SSD不用磁头,寻道时间几乎为0,持续读写的性能非常的惊人。
物理特性,低功耗,无噪音,抗震动,