IBM P系列日常管理——故障定义和故障信息收集

本文详细介绍了IBM P系列服务器的故障定义和信息收集方法,包括错误日志(errlog)分析、控制面板LED代码解读、SMS故障记录、mail通知、诊断程序(Diag)使用以及其他系统信息命令,旨在帮助管理员快速定位并解决系统故障。
摘要由CSDN通过智能技术生成

                                                        服务器的故障定义和故障信息收集

一:弄清楚系统发生了什么问题

  1. 系统现在能做什么?不能做什么?
  2. 故障什么时候发生的?
  3. 有没有做平时不同的操作?
  4. 故障有没有规律?定时还是不定时?发生的频率有多高?
  5. 是一台机器出现故障还是多台机器故障?故障现象是否相同?
  6. 最近有没有做改动?如安装了新的硬件、软件,改变了系统的一些设置。

二:收集故障信息对于判断、诊断故障原因,修复系统非常重要。

A:系统故障记录(errorlog)

  1. errdemon进程在系统启动时自动运行
  2. 记录包括硬件、软件及其他操作信息
  3. 故障记录文件为/var/adm/ras/errlog,可备份下来或拷贝到别的机器上分析
  4. errpt 命令的使用(普通用户权限也可使用)

例如:#errpt  |more 列出简短出错信息

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值