3.1 查看基本概况信息
本功能用于查看服务器的整体概况,包括基本状态、基本信息、告警信息、服务器电源状态、UID灯状态、TPM/TCM状态和用户会话等。
1. 操作步骤
(1) 单击[信息/整体概况]菜单项,进入整体概况页面,如图3-1所示。
(2) 查看服务器的整体概况信息。
· 在功能区域1,可以查看当前服务器的整体健康状态。如果子系统健康状态存在问题,可以在对应的部件信息页面查看原因,如图3-2和图3-3所示。
· 在功能区域2,可以查看当前服务器告警状态和数量,点击状态或数量跳转至对应的事件日志页面进行详细了解具体情况。相关功能介绍,请参见事件日志。
¡ 告警信息级别包括如下几种:
- 正常:表示对系统不会产生影响的事件,例如正常的状态变化,告警事件解除。
- 轻微:表示对系统不会产生大的影响,需要尽快采取相应的措施,防止故障升级。
- 严重:表示对系统产生较大的影响,有可能中断部分系统的正常运行,导致业务中断。
- 紧急:表示可能会使服务器下电,系统中断。需要马上采取相应的措施进行处理。
· 在功能区域3,可以查看当前服务器的UID灯状态、服务器电源状态和TPM/TCM状态。
¡ UID灯状态包括如下几种,设置UID灯状态请参见UID灯控制。
- 开启:服务器UID灯蓝色常亮,表示服务器被选中。
- 闪烁:服务器UID灯蓝色闪烁,表示服务器正在进行固件更新,或者远程控制台被打开。
- 关闭:服务器UID灯熄灭,表示服务器未被选中。
¡ 服务器电源状态包括开启和关闭
两种状态,设置服务器电源状态请参见电源控制。
¡ TPM/TCM是内置在主板上的微芯片,拥有独立的处理器和存储单元,用于存储加密信息(如密钥),为服务器提供加密和安全认证服务。关于安装TPM/TCM模块的方法,请参见服务器用户指南。TPM/TCM状态如表3-1所示。
TPM/TCM状态
状态含义
TPM已启用
TPM功能已开启
TPM已禁用
TPM模块已安装,但功能未开启
TPM不在位
未安装TPM/TCM模块
TCM已启用
TCM功能已开启
TCM已禁用
TCM模块已安装,但功能未开启
不支持
TPM/TCM功能不支持
· 在功能区域4,可以查看服务器基本信息。
· 在功能区域5,可以查看当前正在访问HDM的会话信息(包括Telnet、SSH、Web、Serial),其中带*号的表示当前会话。有关会话的详细介绍请参见服务配置。
2. 参数说明
· 系统健康:指示服务器整体的健康状态。
¡
正常:HDM监测的服务器所有组件均正常运行。
¡
紧急、
严重:HDM监测的服务器部分组件发生故障。
· 子系统健康状态:指示服务器子系统的各组件具体状态。
¡
正常:子系统组件运行正常。
¡
严重:子系统组件性能显著下降。
¡
紧急:服务器可能会自动关机以防止组件被损坏。
各子系统健康状态如表3-2所示:
子系统
状态
状态含义
风扇
正常
风扇冗余正常(非关键位置风扇异常)
严重
风扇冗余异常(2个及以上关键位置风扇异常)
温度
正常
组件温度未超过轻微阈值
严重
组件温度达到严重阈值,未超过紧急阈值
紧急
组件温度达到紧急阈值
电源
正常
电源工作正常
严重
电源发生严重错误
电流
正常
主板上各组件的电流未过载
紧急
主板上存在组件的电流过载
电压
正常
各组件电压数值未超过轻微阈值
严重
组件电压数值达到严重阈值,未超过紧急阈值
紧急
· 电压故障触发
· 组件电压数值达到紧急阈值
内存
正常
内存正常
严重
· 发生Memory exception错误
· 全部内存不在位或全部内存被隔离
· 内存发生不可恢复错误
· 内存插法错误或兼容性错误导致BIOS halt在POST阶段
处理器
正常
处理器正常
严重
CPU产生过温告警
紧急
· 主CPU不在位
· CPU产生极限温度告警
· CPU发生不可恢复错误
硬盘
正常
硬盘未出现错误
严重