AIX的日常维护

1,通过HMC连接的主机点击Open terminal时出现open in process Open Completed然后没反应了,打开不了终端。


解决方法:


1、远程以root用户登录主机


2、找出虚拟终端所对应的“串口卡”设备:


# lsdev -C | grep Virtual


vsa0 Defined LPAR Virtual Serial Adapter


vsa1 Defined LPAR Virtual Serial Adapter


vsa2 Available LPAR Virtual Serial Adapter


3、找出虚拟终端所对应的tty设备:


# lsdev -p vsa2


4、启用此tty设备上的登录界面:


# penable vty2


2013年8月2日
在进行IBM P550巡检的时候使用errpt检查发现下面的错误
#errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
D666A8C7   0802140313 T H fcs0           ADAPTER ERROR
D666A8C7   0802140213 T H fcs0           ADAPTER ERROR
D666A8C7   0802140213 T H fcs0           ADAPTER ERROR
D666A8C7   0802140213 T H fcs0           ADAPTER ERROR
详细信息如下:
#errpt -aj D666A8C7 | more
---------------------------------------------------------------------------
LABEL:          FCA_ERR2
IDENTIFIER:     D666A8C7


Date/Time:       Fri Aug  2 14:03:05 BEIST 2013
Sequence Number: 2087
Machine Id:      00C01CE64C00
Node Id:         kjdb1
Class:           H
Type:            TEMP
WPAR:            Global
Resource Name:   fcs0
Resource Class:  adapter
Resource Type:   df1000fe
Location:        U78A0.001.DNWHVZ9-P1-C1-T1
VPD:
Part Number.................10N7255
Serial Number...............1C018081E8
Manufacturer................001C
EC Level....................D76626
Customer Card ID Number.....5774
FRU Number.................. 10N7255
Device Specific.(ZM)........3
Network Address.............10000000C9C042D6
ROS Level and ID............02E8277F
Device Specific.(Z0)........2057706D
Device Specific.(Z1)........00000000
Device Specific.(Z2)........00000000
Device Specific.(Z3)........03000909
Device Specific.(Z4)........FFE01212
Device Specific.(Z5)........02E8277F
Device Specific.(Z6)........06E12715
Device Specific.(Z7)........07E1277F
Device Specific.(Z8)........20000000C9C042D6
Device Specific.(Z9)........ZS2.71X15
Device Specific.(ZA)........Z1F2.70A5
Device Specific.(ZB)........Z2F2.71X15
Device Specific.(ZC)........00000000


Description
ADAPTER ERROR


Recommended Actions
PERFORM PROBLEM DETERMINATION PROCEDURES


Detail Data
SENSE DATA
0000 0010 0000 0027 0502 0000 0000 0000 0001 0A00 22EF 59E4 0002 AEB7 0000 012C
0000 0001 0000 0001 0000 0000 0000 0000 0000 0002 0000 0000 0000 0000 0000 0000
0000 0000 0010 0002 0000 0010 0000 0000 0000 0000 0000 2710 0000 07D0 0000 076C
0000 0064 0000 000F 0000 0000 0000 0000 0000 0000 0000 0000 0006 0000 0000 0000
0019 0300 0000 0908 0010 8000 0800 00FF FFFF 0000 07D0 1000 0000 C9C0 42D6 2000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0300 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0002 0100 8A00 0200
0019 0000 0000 0000 0000 0000 0000 0000 0000 0002 0000 0000 0000 0000 0000 0000
0000 0000 636D 4643 F100 0A0A 0070 17B8 F100 0A0A 0070 182C F100 0A0A 0070 18A0
0000 0000 0004 07B8 0000 0000 0004 082C 0000 0000 0004 08A0 0000 0000 0000 0000
0001 0C03 0000 0000 21FC 0005 1E9C 2AF7 1000 0005 1E9C 2AF7 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0074 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000 0000
---------------------------------------------------------------------------
起初怀疑是HBA卡出问题了,但是去机房检查发现指示灯均正常。连接到存储交换机查看也没有异常,初步判断是临时报错,继续观察。


另附errpt 输出信息的详细解释
1.错误标示符IDENTIFIER:并不唯一,由它来确定使用的错误模板,显然同一种错误的IDENTIFIER是相同的。
2.时间戳TIMESTAMP:错误发生的时间,MMDDhhmmYY,依次表示月日时分年。
3.类型TYPE:错误的类型,或者说严重的程度。    分为6个:
PEND 设备或功能组件可能丢失 简写P
PERF 性能严重下降 P
PERM 硬件设备或软件模块损坏,确诊了的 P
TEMP 临时性错误,经过重试后已经恢复正常 T
INFO 一般消息,不是错误 I
UNKN 不能确定错误的严重性 U
4.种类CLASS c:指出错误源    H 硬件或介质故障    S 软件故障    O 人为错误    U 不能确定
5. 资源名RESOURCE_NAME
最初检测到错误的资源名软件或者硬件,并不代表这个资源有问题,而只是最先在它发现的。
6.描述


2013.8.29
aix巡检查看HACMP状态时发现有一个进程没起来,具体如下:
#./clshowsrv -v
Status of the RSCT subsystems used by HACMP:
Subsystem         Group            PID          Status
topsvcs          topsvcs          4784376      active
grpsvcs          grpsvcs          4915578      active
grpglsm          grpsvcs                       inoperative
emsvcs           emsvcs           3866690      active
emaixos          emsvcs           9764866      active
ctrmc            rsct             3801592      active


Status of the HACMP subsystems:
Subsystem         Group            PID          Status
clcomdES         clcomdES         3539194      active
clstrmgrES       cluster          3866882      active


Status of the optional HACMP subsystems:
Subsystem         Group            PID          Status
clinfoES         cluster          12321116     active
这个进程无关紧要,不活动不会影响集群状态
详细解释如下:
he grpglsm subsystem is only responsible for handling the various PSSP
switch adapters (css*), and the new federation adapters (sn*); it has
nothing to do with standard ethernet switches. I
believe at one time grpglsm would simply sit and do nothing on an HACMP
cluster without one of these adapters on it. Now it simply shutsdown
when not needed. This is normal, and nothing you need to worry about,
unless you are using one of those adapter types.
So I think that answers this questions.


2013年12月2日 NFS报错
# mount test23:/arch_test23 /arch_test23
mount: 1831-011 access denied for lydb23:/test23
mount: 1831-008 giving up on:
test:/test23
The file access permissions do not allow the specified action.
解决方法
1 ,将文件 /etc/exports 中 "access=xxxxx" 的部分刪除;
2 ,在服务器端运行 #  exportfs  -a
重新挂在即可


2014.1.10
主机报错
# errpt
IDENTIFIER TIMESTAMP  T C RESOURCE_NAME  DESCRIPTION
EAA3D429   0110083214 U S LVDD           PHYSICAL PARTITION MARKED STALE
EAA3D429   0110083214 U S LVDD           PHYSICAL PARTITION MARKED STALE
EAA3D429   0110083214 U S LVDD           PHYSICAL PARTITION MARKED STALE
EAA3D429   0110083214 U S LVDD           PHYSICAL PARTITION MARKED STALE
查看详细报错信息
# errpt -aj EAA3D429
---------------------------------------------------------------------------
LABEL:          LVM_SA_STALEPP
IDENTIFIER:     EAA3D429


Date/Time:       Fri Jan 10 08:32:23 BEIST 2014
Sequence Number: 1672
Machine Id:      00CFF5FF4C00
Node Id:         fsdb2
Class:           S
Type:            UNKN
Resource Name:   LVDD


Description
PHYSICAL PARTITION MARKED STALE


Detail Data
PHYSICAL VOLUME DEVICE MAJOR/MINOR
8000 0016 0000 0000
PHYSICAL PARTITION NUMBER (DECIMAL)
362
LOGICAL VOLUME DEVICE MAJOR/MINOR
8000 000A 0000 000A
SENSE DATA
00CF F5FF 0000 4C00 0000 0126 06A0 ED66 00CF F5FF B95A E907 0000 0000 0000 0000
怀疑是硬盘问题,继续排查
# lsvg -p rootvg
rootvg:
PV_NAME           PV STATE          TOTAL PPs   FREE PPs    FREE DISTRIBUTION
hdisk0            active            546         112         29..25..00..00..58
hdisk1            missing           546         112         29..25..00..00..58
到这里确定硬盘出现错误。
尝试找回
# chpv -va hdisk1
0516-1010 chpv: Warning, the physical volume hdisk1 has open logical
volumes.  Continuing with change.
更换步骤:
1、破除镜像
把HDISK1从ROOTVG中不做MIRROW:
#unmirrorvg rootvg hdisk1
#reducevg rootvg hdisk1
删除HDISK1
#rmdev –dl hdisk1
在hdisk1上创建boot image
#bosboot –ad /dev/hdisk0
改变启动设备的顺序
#bootlist –m normal hdisk0 cd0
确认硬盘位置,然后进行更换
更换后的操作
1.把hdisk1加进rootvg卷组:
#extendvg rootvg hdisk1
2.关掉rootvg的 QUORUM功能:
#chvg -Qn rootvg
3.镜像rootvg
#mirrorvg -c 2 rootvg
4.重新生成 boot image
#bosboot -ad /dev/hdisk1
5.更新bootlist
#bootlist -m normal hdisk0 hdisk1 cd0
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值