原标题:《七小服公开课》IBM P780日常维护
1. P780下电步骤
注意:下电之前做好数据的备份工作,并且联系厂商工程师,建议在厂商工师在现场的情况下进行下电工作。在下电之前做好数据的备份,异常断电可能导致用户数据丢失!
下电顺序:先停业务应用,然后停止单个Lpar分区,最后power off 服务器
2. 关掉应用
手动关闭应用、数据库与双机,确保服务器没有业务访问。
3. 关闭Ipar分区
4. power off 服务器
5. 机柜断电/加电顺序
ESE 机柜断电 1至4机柜 按顺序断电 然后是io柜
ESE机柜加电 3-4-1-2 按以上数字机柜顺序加电 然后是io柜
6. 检查服务器状态
通过lE浏览器https://88.100.13.200
用户名:hscroot
密码:*******
检查相应服务器名称后是否有叹号图标显示,如有就进一步查看报错日志。
操作步骤如下:
选择hmc管理选项——》查看HMC 事件 通过报错信息对故障进行初判
7. P780故障检查
登录服务器 用户名:monitor 密码:monitor
#errpt
#errpt –aj A2205861|more
注释:errpt参数详解
这里的输出分为六列依次为:
1.错误标示符IDENTIFIER:并不唯一,由它来确定使用的错误模板,显然同一种错误 的IDENTIFIER是相同的。
2.时间戳TIMESTAMP:错误发生的时间,MMDDhhmmYY,依次表示月日时分年。
3.类型TYPE:错误的类型,或者说严重的程度。
分为6个:
PEND 设备或功能组件可能丢失 简写P
PERF 性能严重下降 P
PERM 硬件设备或软件模块损坏,确诊了的 P
TEMP 临时性错误,经过重试后已经恢复正常 T
INFO 一般消息,不是错误 I
UNKN 不能确定错误的严重性 U
4.种类CLASS c:指出错误源
H 硬件或介质故障
S 软件故障
O 人为错误
U 不能确定
5.资源名RESOURCE_NAME
最初检测到错误的资源名软件或者硬件,并不代表这个资源有问题,而只是最先在它发 现的。
8. P780 数据监控
1. #lsdev –Ccdisk //存储硬盘监控
2. #df -g //文件系统使用监控
3. #netstat –in//查看网络配置
4. #nmon // cpu使用情况监控
5. #nmon // mem使用情况监控
6.#nmon // 网络参数监控
7. #nmon // 硬盘使用情况监控
未完待续--
责任编辑: