曙光服务器显示psu故障,排除故障a.c. -系列服务器重新启动

本文详细介绍了如何通过CIMC管理控制器、操作系统日志(如ESXi、RHEL和Windows)以及OBFL日志来诊断和分析服务器因PSU故障导致的意外重启。日志分析包括了从OS层面的重新启动、硬件故障(如PSU问题)引起的断电,以及前面板按钮触发的停电和启动事件。通过收集和分析这些日志,可以确定服务器状态变化的原因并采取相应措施。
摘要由CSDN通过智能技术生成

简介

本文描述如何确定重新启动或关闭是否启动在硬件方面或从操作系统(OS)。

当您为什么确定服务器重新启动的或关闭时,有着重的几个好日志位置。当您通过思科集成管理控制器(CIMC)时技术支持搜索,请查找/var/log/messages或失败记录日志(OBFL)日志。

在本文提供的示例输出是从/var/log/messages或OBFL以及OS日志ESXi、RHEL和Windows的。

本文档没有任何特定的要求。

使用的组件

本文档中的信息基于以下软件和硬件版本:

思科统一计算系统(UCS) C200-M1固件版本1.4(3w)

Cisco UCS C210-M2固件版本1.4(3w)

Cisco UCS C220-M3固件版本2.0(3d)

Cisco UCS C220-M4固件版本2.0(3f)

ESXi 5.0 U2

RHEL 6.6

Windows 2008个R2

本文档中的信息都是基于特定实验室环境中的设备编写的。本文档中使用的所有设备最初均采用原始(默认)配置。如果您使用的是真实网络,请确保您已经了解所有命令的潜在影响。

背景信息

重新启动可以是预计或意外的。当重新启动预计时,也许是不是所有的主要负责人期待它。有更改控制进程适当所有重新启动的是重要的或关闭维护任务为了保证大家知道操作。

预计重新启动

这是由人、进程或者脚本故意地启动的所有重新启动或关闭事件。这可以在几个方式之一中启动。重新启动发生的方案的这些日志片断可帮助识别,因此您能搜寻谁或什么采取了行动:

通过CIMC GUI

从OS

当您按在服务器的前面的前面板按钮

意外的重新启动

这是没有计划也没有预计的所有重新启动,但是可能由起动操作的人或进程仍然预计。 并且,也许已经有一个硬件故障类似一PSU失败或断电在数据中心。这些可以启动用几个方式。

如果确定前面板按钮按,您能搜寻谁访问物理访问数据中心在重新启动时。如果它是电源问题,请从事数据中心团队发现是否当时有电源故障。

通过CIMC GUI

从OS

当您按在服务器的前面的前面板按钮

从硬件故障例如PSU失败或坏电源电缆

功率分配单元(PDU)失败在数据中心

不间断电源(不间断电源)失败或断电或者灯火管制在数据中心

关键点

CIMC启动的重新启动、关闭和电源ons在日志总是包括“do_power”关键字。

当您运行固件版本时,前面板按钮按包括"passthrough_pin2_isr"。并且,没有可能的从此的关联的OS级别事件。

OS起动重新启动,并且关闭有一个相关的OS级别事件。并且请注意“do_power”没有被记录,并且“高压模式”可以被记录。

聚集分析的日志促销包

在您检查相关日志前,您首先需要生成日志套件。当您比较对在本文的输出示例请使用这些资源为了创建必要的日志供参考为:

C系列CIMC技术支持

ESXi

RHEL

Windows

不同的重新启动和关闭情况的预期的输出

从OS的重新启动- ESXi、RHEL和Windows

OBFL日志

5:2017 Mar  2 09:46:44:BMC:kernel:-:<5>[lpc_reset_isr_handler]:79:LPC Reset ISR -> ResetState: 1

5:2017 Mar  2 09:46:44:BMC:kernel:-:<5>[readPostData]:525:BIOS_POST_CMPLT Asserted --> BIOS has completed

5:2017 Mar  2 09:46:44:BMC:kernel:-:<5>[lpc_reset_isr_handler]:79:LPC Reset ISR -> ResetState: 0

5:2017 Mar  2 09:46:44:BMC:kernel:-:<5>[lpc_reset_handler_Port80_Capture_setup]:566:

BIOS_POST_CMPLT De-asserted --> BIOS is running

5:2017 Mar  2 09:46:44:BMC:kernel:-:<5>[block_transfer_fetch_host_request_for_app]:1860:

block_transfer_fetch_host_request_for_app: BT_OPEN_FOR_READ: HostDescriptor = 4740 : Filename = BiosTech_7.txt

5:2017 Mar  2 09:46:44:BMC:BIOSReader:1304: BIOSReader.c:242:File Open : BiosTech_7.txt

5:2017 Mar  2 09:46:44:BMC:kernel:-:<5>[block_transfer_fetch_host_request_for_app]:1944:

block_transfer_fetch_host_request_for_app : BT_FILE_CLOSE : HostBTDescr = 4740 : FName = BiosTech_7.txt

5:2017 Mar  2 09:46:44:BMC:BIOSReader:1304: BIOSReader.c:748:File Close : /var/nuova/BIOS/BiosTech_7.txt

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: lv_dimm.c:129:[lpc_reset_seen]

LPC Reset Count is Different [0x77:0x78] Asserted LPC Reset Seen

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x83.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x84.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x85.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x86.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x89.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x8a.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x91.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x92.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: lv_dimm.c:200:[transition_function]

Starting Transition to [High Voltage Mode] from [Unknown Mode]

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x83.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x84.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x85.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x86.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x89.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x8a.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x91.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: common.c:940:Disabling Sensor scan for sensor 0x92.

5:2017 Mar  2 09:46:44:BMC:lv_dimm:1625: lv_dimm.c:220:[transition_function]

Transition to [High Voltage Mode] Success

...

5:2017 Mar  2 09:47:01:BMC:BIOSReader:1304: BIOSReader.c:748:File Close : /var/nuova/BIOS/DimmTempOffset

5:2017 Mar  2 09:47:06:BMC:kernel:-:<5>[lpc_reset_isr_handler]:79:LPC Reset ISR -> ResetState: 1

5:2017 Mar  2 09:47:06:BMC:kernel:-:<5>drivers/bmc/usb/usb1.1/se_pilot2_udc_usb1_1.c:2290:

USB FS: VDD Power WAKEUP- Power Good = OFF

5:2017 Mar  2 09:47:06:BMC:BIOSReader:1304: BIOSReader.c:748:File Close : /var/nuova/BIOS/BiosTech.txt

5:2017 Mar  2 09:47:06:BMC:kernel:-:<5>[se_pilot2_wakeup_interrupt]:2561:USB HS: VDD Power = OFF

5:2017 Mar  2 09:47:06:BMC:kernel:-:<5>[block_transfer_fetch_host_request_for_app]:1944:

block_transfer_fetch_host_request_for_app : BT_FILE_CLOSE : HostBTDescr = 4756 : FName = BiosTech.txt

5:2017 Mar  2 09:47:06:BMC:IPMI:1497: Rack_FanCtrl.c:1183:fscUpdateActualFanPolicyFile:

Applied Policy: N/A, Configuration Status: PENDING - Host powered off

5:2017 Mar  2 09:47:06:BMC:IPMI:1466: Pilot2SrvPower.c:466:Blade Power Changed To: [ OFF ]

5:2017 Mar  2 09:47:06:BMC:selparser:1547: selparser.c:710:

# 7E 03 00 00 01 02 00 00 6A 30 B8 58 20 00 04 25 05 00 00 00 08 00 FF FF # 37e | 03/02/2017 09:47:06

| CIMC | Entity presence MAIN_POWER_PRS #0x05 | Device Absent | Asserted

...

5:2017 Mar  2 09:47:12:BMC:kernel:-:<5>[se_pilot2_wakeup_interrupt]:2561:USB HS: VDD Power = ON

5:2017 Mar  2 09:47:12:BMC:kernel:-:<5>[se_pilot2_udc_usb_connect]:2685:Failed  USB2.0 register test

5:2017 Mar  2 09:47:12:BMC:kernel:-:last message repeated 2 times

5:2017 Mar  2 09:47:12:BMC:kernel:-:<5>[lpc_reset_isr_handler]:79:LPC Reset ISR -> ResetState: 0

5:2017 Mar  2 09:47:12:BMC:kernel:-:<5>[lpc_reset_handler_Port80_Capture_setup]:566:

BIOS_POST_CMPLT De-asserted --> BIOS is running

5:2017 Mar  2 09:47:12:BMC:kernel:-:<5>[block_transfer_fetch_host_request_for_app]:1860:

block_transfer_fetch_host_request_for_app: BT_OPEN_FOR_READ: HostDescriptor = 4778 : Filename = BiosTech_7.txt

5:2017 Mar  2 09:47:12:BMC:BIOSReader:1304: BIOSReader.c:242:File Open : BiosTech_7.txt

5:2017 Mar  2 09:47:12:BMC:kernel:-:<5>[block_transfer_fetch_host_request_for_app]:1944:

block_transfer_fetch_host_request_for_app : BT_FILE_CLOSE : HostBTDescr = 4778 : FName = BiosTech_7.txt

5:2017 Mar  2 09:47:12:BMC:BIOSReader:1304: BIOSReader.c:748:File Close : /var/nuova/BIOS/BiosTech_7.txt

5:2017 Mar  2 09:47:12:BMC:selparser:1547: selparser.c:710:

# 7F 03 00 00 01 02 00 00 6F 30 B8 58 20 00 04 25 05 00 00 00 08 01 FF FF # 37f

| 03/02/2017 09:47:11 | CIMC | Entity presence MAIN_POWER_PRS #0x05 | Device Present | Asserted

5:2017 Mar  2 09:47:12:BMC:IPMI:1495: Pilot2SrvPower.c:466:Blade Power Changed To: [ ON ]

检查ESXi日志关于OS为什么的更多信息起动此事件。

/var/log/vmksummary.log

/var/log/vmker

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值