IBM-P630、P650、B80 P650 本地硬盘更换

IBM-P630、P650、B80 P650 本地硬盘更换


1.操作说明
1)适用平台:Software: AIX 5.2 + HACMP5.1
Hardware: PowerPC_POWER4 P630、P650、B80 Dual 、P650 Dual、B80 Dual
说明:
本手册用于指导在IBM PowerPC_POWER4P630、P650、B80、P650、B80双机上更换本地硬盘.。
2)可以通过以下命令来确定当前主用机:
#lsvg -o
如果输出中有datavg,则当前主机即为主用机.
3). 更换过程中任何一步骤输出异常,根据屏幕打印查看错误日志,进行排错。如果操作不成功,除非特殊说明,不允许进行后续操作。
4). 本文以一号主机为例,说明一号主机本地硬盘更换过程。
2 smitty mksysb 备份系统和倒换测试
说明:
系统备份在两台小型机上进行。
本步骤可以安排客户自行做好数据备份。
系统备份只是备份本地硬盘数据,如果在主用机上备份时,会占用一部分的系统资源,所以在备份的时候,先把应用进行切换。
说明:
由于更换硬盘不当可能导致系统级问题,因此,务必做好双机系统文件备份。

下面以server1为主机,server2为备机情况为例
2.1 备份2号主机数据
说明:
在进行server2的系统之前,确保server2不是当前资源组的主节点,否则需要将资源组从server2切换到server1。

(1) 在备用主机上插入磁带,执行以下命令。
smitty mksysb
(2) 在Backup DEVICE or FILE域中按或,选择/dev/rmt0。
/dev/rmt0 SCSI 4mm Tape Drive
(3) 选择完成后,按回车执行。
该步骤大约需要1小时,系统提示OK后,按[ESC+0]退出。
(4) 执行
mt rewind
mt offline
(5) 取出磁带
并在磁带标签上写上:
mksysb。
2.2 倒换测试
说明:
在进行server1的系统备份之前,需要使所有资源组切换到server2,使得server2成为资源组主节点。

# sync; sync
# clstop -gry -N
倒换时间在一般在2-4分钟内。等待5分钟后往下执行:
# /usr/es/sbin/cluster/etc/rc.cluster -boot -i
# server1重启动HA
# rsh server2
# 在server2器上检测是否成功倒换
server2> lsvg -o
# 看一下是否有datavg
做几项简单的拨打测试,确保正确通过。
2.3 备份1号主机数据
(1) 在1号主机上插入磁带,执行以下命令。
server1 > smitty mksysb
(2) 在Backup DEVICE or FILE域中按或,选择/dev/rmt0。
/dev/rmt0 SCSI 4mm Tape Drive
(3) 选择完成后,按回车执行。
该步骤大约需要1小时,系统提示OK后,按[CTRL+C]退出。
(4) 执行
# mt rewind
# mt offline
(5) 取出磁带
并在磁带标签上写上:
server1 mksysb。
2.3 倒换测试
说明:
在server1备份完之后,将所有资源组切换回server1,准备在server1上进行应用数据备份。

server2> sync; sync
server2> clstop -gry -N
等待5分钟,确保倒换完成后往下执行:
server2> /usr/es/sbin/cluster/etc/rc.cluster -boot -i
# server2重启动HA
# lsvg -o
# 在1号主机上,查看是否有datavg
再次做一下简单的拨打测试,确保通过。
3 应用数据备份
说明:
在对不同的HLR产品的应用数据进行备份时,备份脚本路径以及生成备份文件路径各不相同,请参考下列描述。

在主用机上运行,如果此时server1为主用机.
将共享盘上oracle数据备份到server1器并copy到server2器。
[ GSM ]
hwhlr-ph1> /opt/gsmhlr/tools/backup/backupmt.sh
Now do exporting ......... OK
Now copy the backup file to another computer's disk ...... Done
Today is Fri Dec 16 15:30:14 GMT 2022, Data will be backuped to tape.
... ...
检查是否有对应的备份文件产生,注意新文件的产生时间为当前时间。
hwhlr-ph1> ls –al /opt/gsmhlr/sysbackup/userdata/*

[ CDMA ]
hwhlr-ph1> /opt/cdmahlr/tools/backup/backupmt.sh
Now do exporting ......... OK
Now copy the backup file to another computer's disk ...... Done
Today is Fri Dec 16 15:30:14 GMT 2022, Data will be backuped to tape.
... ...
检查是否有对应的备份文件产生,注意新文件的产生时间为当前时间。
hwhlr-ph1> ls –al /opt/cdmahlr/sysbackup/userdata/*

[9820]
# /opt/hlr/tools/backup/backupmt.sh hdu
Now do exporting ......... OK
Now copy the backup file to another computer's disk ...... Done
Today is Fri Dec 16 15:30:14 GMT 2022, Data will be backuped to tape.
... ...
检查是否有对应的备份文件产生,注意新文件的产生时间为当前时间。
# ls –al /opt/hlr/sysbackup/userdata/*

4 应用检查
4.1 替换主用机本地硬盘先将应用倒换到备用机运行
说明:
在对server1进行硬盘更换之前,请务必先将应用切换到server2,否则可能会导致业务中断。

# clstop -gry -N
倒换时间在一般在2-4分钟内。等待5分钟后往下执行:
# /usr/es/sbin/cluster/etc/rc.cluster -boot -i
# server1重启动HA
# rsh server2
# 在server2器上检测是否成功倒换
server2> lsvg -o
# 看一下是否有datavg
做几项简单的拨打测试,确保正确通过。
4.2 替换备用机硬盘不需要切换应用
说明:
如果需要更换硬盘的机器当前没有任何应用,不需要进行应用切换。

5 检查硬件和errpt log
# errpt -dH
server2> errpt -dH
如何判断硬盘硬件错误?
在root用户下执行errpt -dH,
IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESCRIPTION
16F35C72 1011115506 P H hdisk0 DISK OPERATION ERROR
16F35C72 1011075106 P H hdisk0 DISK OPERATION ERROR
16F35C72 1011034606 P H hdisk0 DISK OPERATION ERROR
49A83216 1011002006 T H hdisk0 DISK OPERATION ERROR
49A83216 1011001706 T H hdisk0 DISK OPERATION ERROR
49A83216 1011001606 T H hdisk0 DISK OPERATION ERROR
49A83216 1010234606 T H hdisk0 DISK OPERATION ERROR
检查T列是否有T类和P类错误,有T类和P类错误行对应的hdiskX即为有错误的硬盘。
T类错误:临时错误;P类错误:永久错误。

6 查看坏的hdd的信息(s/n , scsi id)
说明:
在确定了错误的硬盘之后,查看错误硬盘信息,确定错误硬盘物理位置。

server1 > lscfg -vl hdiskX
server1 > lsdev -Cc disk
说明:
仅在存在坏盘主机上执行。
此处的diskX中的X为坏盘的盘号。
如何确定OS识别到硬盘与物理位置对应关系?
在root用户下执行lscfg -vl hdiskX
显示如下:
hdiskX U0.1-P2/Z1-A9 16 Bit LVD SCSI Disk Drive (36400 MB)
其中红色字体部分可能出现字符为8,9,a,b,分别对应硬盘物理插框位置。
在root用户下执行lsdev –Cc disk
显示如下:
hdiskX Available 1S-08-00-8,0 16 Bit LVD SCSI Disk Drive
其中红色字体部分可能出现字符为8,9,a,b,分别对应硬盘物理插框位置。
对于同一块硬盘,lscfg与lsdev对应字符一致,对应硬盘插框位置。
对应关系如下:

上方编号8,9,10,11为机器插框外编号。
下方编号8,9,a,b为OS中识别到的编号。
在进行更换硬盘之前,需要确定好坏硬盘的物理位置,以免更换错误。
7 拆镜像
说明:
在更换硬盘之前,首先需要对进行镜像的磁盘去镜像,接着从rootvg中将坏掉的硬盘拆分出来。

server1 > unmirrorvg rootvg hdiskX
server1 > reducevg rootvg hdiskX
8 修改启动次序
说明:
在去镜像之后,需要系统boot设备顺序修改,只将正常硬盘加入到boot设备列表中。

server1 > bootlist -om normal hdiskY
这里的hdiskY为正常硬盘在OS里的逻辑名称。
9 关机更换hdd
说明:
更换硬盘时,请注意对应上面识别到的物理位置。

10 加电
11 配置hdd: cfgmgr -v
server1 > lsdev -Cc disk
server1 > rmdev -dl hdiskX
server1 > cfgmgr -v
server1 > lsdev -Cc disk
12 新的hdd加入rootvg:
server1 > chdev -l hdiskX -a pv=yes
server1 > extendvg rootvg hdiskX
13 镜像rootvg
server1 > mirrorvg rootvg hdiskX
14 bos image
server1 > bosboot -ad /dev/hdiskX
15 重新修改启动次序
server1 > bootlist -m normal hdisk0 hdisk1 cd0 rmt0
更新NVRAM中的引导设备标。
16 检查硬件和errpt log
# errpt -dH
# diag
server2> errpt -dH
server2> diag
17 启动应用和hacmp
说明:
启动HA在两台小型机上进行。
启动cluster的目的是验证cluster配置是否正常,并将启动cluster的代码写入/etc/inittab中。
server1 > /usr/es/sbin/cluster/etc/rc.cluster -boot -i
18 替换server1本地硬盘需要将应用倒换回1号主机
server2> sync; sync
server2> clstop -gry -N
等待5分钟,确保倒换完成后往下执行:
server2> /usr/es/sbin/cluster/etc/rc.cluster -boot -i
# server2重启动HA
# lsvg -o
# 到1号主机上查看是否有datavg
再次做一下简单的拨打测试,确保通过。
注意:
替换2号主机本地硬盘,本步骤不需要操作。
19 清除系统所有故障记录
server2> errclear 0
# errclear 0

[@more@]

来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/9479798/viewspace-1050084/,如需转载,请注明出处,否则将追究法律责任。

转载于:http://blog.itpub.net/9479798/viewspace-1050084/

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值