一 、 服务器硬件检查
检查项 | 检查操作 | 参考标准 | 巡检情况 |
---|---|---|---|
机柜或者机器上的防尘网 | 观察机柜以及机器上的防尘网上的灰尘 | 是否在防尘上堵塞导致气流不畅。 | |
系统风扇运转检查 | 观察并用手感觉进风和出风是否正常 | 主机和磁盘柜的所有风扇运转正常。 | |
系统运装噪音检查 | 仔细听系统运转声音 | 噪音是否过大,有无异常声音 | |
系统电源指示灯检查 | 观察液晶面板、电源指示灯、硬盘报警灯等显示 | 液晶面板、电源指示灯、硬盘报警灯等显示情况正常 | |
服务器硬盘工作状态 | 硬盘指示灯指示是否正常,一般绿色为正常 | 绿色闪烁 | |
检查网线是否连接正常 | 检查网线与交换机之间的连线是否正常,以及双机心跳网线连接是否正常 | 交换机连接主机的所有端口指示灯为长亮,双机系统的公网与交换机之间的连接应为交叉连接。 | |
服务器网卡工作状态 | 服务器插上网线后,若有数据传输,则网卡指示灯呈现规律性闪烁;若闪烁不正常或指示灯指示颜色不正常,则说明系统数据传输将不正常 | 网卡指示灯正常闪烁 | |
服务器散热检测 | 靠近服务器检查是否有热风吹出 | ||
服务器电源连接检查 | 电源连接线是否有松动、接触不良等情况 | ||
服务器外壳整体检查 | 服务器整体是否有移动或损害痕迹 | ||
服务器机房温度 | 机房的温度是否异常变动,温度数值多少 | 参考值温度:20℃-26℃ | |
服务器机房湿度 | 机房的湿度是否异常变动,湿度计数值多少 | 参考值温度:45%-60% | |
服务器机房静电防护 | 防静电地板是否损坏,防静电设备是否正常 | ||
服务器标签检查 | 标签是否松动、脱落,字体是否模糊不清 |
二、 操作系统检查
检查项 | 检查操作 | 参考标准 | 巡检情况 |
---|---|---|---|
操作系统版本检查 | 执行命令uname –a | ||
系统账户检查 | 利用root身份、口令登陆 | 能够正常登陆到系统 | |
系统运行状态 | #uptime | 系统UP时间应该为上次重启导目前的时间 |
三、 性能检查
检查项 | 检查操作 | 参考标准 | 巡检情况 |
---|---|---|---|
检查各进程资源CPU占用率 | #top -c | CPU使用率小于80% | |
检查各进程资源内存占用率 | #top –c | 内存使用率小于80% | |
检查各进程资源内存交换区使用率 | #top –c | 内存交换区使用率小于80% | |
进出占用资源检查 | #top –c 进程名 | 查看系统最占资源的进程、查看具体某个进程占用资源的具体情况 |
四、 Top命令
统计信息区
前五行是系统整体的统计信息。第一行是任务队列信息,同 uptime 命令的执行结果。其内容如下:
16:35:22 | 当前时间 |
---|---|
4 user | 系统运行时间,格式为时:分 |
load average: 0.15, 0.15, 0.08 | 系统负载,即任务队列的平均长度。 三个数值分别为 1分钟、5分钟、15分钟前到现在的平均值。 |
Tasks: 366 total | 进程总数 |
---|---|
4 user | 系统运行时间,格式为时:分 |
1 running | 正在运行的进程数 |
364 sleeping | 睡眠的进程数 |
0 stopped | 停止的进程数 |
1 zombie | 僵尸进程数 |
Cpu(s): 0.3% us | 用户空间占用CPU百分比 |
0.0% sy | 内核空间占用CPU百分比 |
0.0% ni | 用户进程空间内改变过优先级的进程占用CPU百分比 |
99.9% id | 空闲CPU百分比 |
0.0% wa | 等待输入输出的CPU时间百分比 |
0.0% hi | |
0.0% si |
第五行以后内容是内存信息。内容如下:
Mem: 16429816k total | 物理内存总量 |
---|---|
16366812k used | 使用的物理内存总量 |
63004k free | 空闲内存总量 |
377544k buffers | 用作内核缓存的内存量 |
Swap: 18481144k total | 交换区总量 |
320k used | 使用的交换区总量 |
18480824k free | 空闲交换区总量 |
7835708k cached | 缓冲的交换区总量。 内存中的内容被换出到交换区,而后又被换入到内存,但使用过的交换区尚未被覆盖, 该数值即为这些内容已存在于内存中的交换区的大小。 相应的内存再次被换出时可不必再对交换区写入。 |
PID 每个进程的父进程ID。
USER 每个进程所有者的用户名。
PR 每个进程的优先级别。
NI 该进程的优先级值。
VIPT 该进程的代码大小加上数据大小再加上堆栈空间大小的总数。单位是KB。
RES 该进程占用的物理内存的总数量,单位是KB。
SHR 该进程使用共享内存的数量。
S 该进程的状态。其中S代表休眠状态;D代表不可中断的休眠状态;R代表运行状态;Z代表僵死状态;T代表停止或跟踪状态。
CPU % 该进程自最近一次刷新以来所占用的CPU时间和总时间的百分比。
MEM% 该进程占用的物理内存占总内存的百分比。
TIME+ 该进程自启动以来所占用的总CPU时间。如果进入的是累计模式,那么该时间还包括这个进程子进程所占用的时间。且标题会变成CTIME。
COMMAND 该进程的命令名称,如果一行显示不下,则会进行截取。内存中的进程会有一个完整的命令行。