IBM HACMP实施文档
目 录
一、硬件环境
二、HA安装
三、HA卸载
四、HA故障恢复后的重新同步
一、硬件环境
1、物理机:小型机P740两台
2、操作系统:AIX 7.1+SP4补丁
3、存储:IBM V7000
4、磁盘:从V7000划分,两块本地盘给到小型本地用,一块公共心跳盘,一块数据盘。
二、HA安装
1、安装介质传输。
将HA安装软件HA6.1.ISO通过ftp分别传输到两台小机。
2、挂载安装目录
loopmount -i /tmp/ddd/HA-6.1.iso -o "-v cdrfs -o ro" -m /ha
/tmp/ddd/HA-6.1.iso ISO文件路径
/ha 挂载点
3、 smit install命令开始安装HA软件
选择安装项目时不安装如下两项:
cluster.es.worksheets
+ 6.1.0.0 Online Planning Worksheets
cluster.hativoli
+ 6.1.0.0 HACMP Tivoli Client
+ 6.1.0.0 HACMP Tivoli Server
安装一般会提示fail,输入smit hacmp,能进入hacmp配置界面则表示安装成功。
4、安装HACMP集群软件补丁
将SP14补丁传送到两个服务器节点上,并分别安装
5. 规划IP资源
主机 | 内 容 | 备注 | |
erpap1 | erpap1_boot1 | 10.10.10.22 | 对应端口:en4 |
erpap1_boot2 | 10.10.20.22 | 对应端口:en5 | |
erpap1主IP | 192.168.0.135 | persistip | |
erpap2 | erpap2_boot1 | 10.10.10.21 | 对应端口:en4 |
erpap2_boot2 | 10.10.20.21 | 对应端口:en5 | |
erpap2主IP | 192.168.0.136 | persistip | |
HA漂移地址 | erpapdata01 | 192.168.0.137 | IP Alias方式群集漂移IP |
6. 重配别名IP
将两个节点的网卡参考上表修改好。
在节点1运行如下命令:
ifconfig en4 192.168.0.135 netmask 255.255.255.0 alias
在节点2运行如下命令:
ifconfig en4 192.168.0.136 netmast 255.255.255.0 alias
7. 配置/etc/hosts
在kwerpap1、kwerpap2的/etc/hosts文件中添加如下内容:
192.168.0.135 ap1
10.10.10.22 ap1_boot1
10.10.20.22 ap1_boot2
192.168.0.136 ap2
10.10.10.21 ap2_boot1
10.10.20.21 ap2_boot2
8、在两个节点上分别创建DATAVG
varyoffvg datavg ——停止DATAVG
9、确认DATAVG的活动状态为空后,将DATAVG导入到节点2.
节点一运行ls –al /dev/datavg,找到VGID。
# ls -al /dev/datavg
crw-rw---- 1 root system 44, 0 Jan 14 18:52 /dev/datavg
节点二运行如下命令导入DATAVG。
# chdev -l hdisk3 -a pv=yes --格式化磁盘
hdisk3 changed
# chdev -l hdisk4 -a pv=yes --格式化磁盘
hdisk4 changed
# lspv
hdisk0 00f987cafd873e58 rootvg active
hdisk1 00f987ca71359f42 rootvg active
hdisk2 none None
hdisk3 00f987cbeb135fc9 None
hdisk4 00f987cbeb1360c5 None
# importvg -y datavg -V 44 hdisk3 从节点1导入datavg,vgid为44
synclvodm: No logical volumes in volume group datavg.
datavg
# ls -l /dev/datavg --操作完成,验证
crw-rw---- 1 root system 44, 0 Jan 14 19:31 /dev/datavg
10. 建立双机互信
vi /usr/es/sbin/cluster/etc/rhosts
两个节点内容一致,如下图:
192.168.0.135
10.10.10.22
10.10.20.22
192.168.0.136
10.10.10.21
10.10.20.21
192.168.0.137
11. 建立PowerHA Aplication Server启停脚本,两个节点都要建立
mkdir /HA61
touch /HA61/apstart.sh
touch /HA61/apstop.sh
cd /HA61/
chmod 755 /HA61/*
12. 添加HACMP集群
# smit hacmp
Extended Configuration
Extended Topology Configuration
Configure an HACMP Cluster
Add/Change/Show an HACMP Cluster
13. 创建集群节点
# smit hacmp
Extended Configuration
Extended Topology Configuration
Configure HACMP Nodes
Add a Node to the HACMP Cluster
--分别基于每个网卡配置集群节点
14. 配置集群网络
# smit hacmp
Extended Configuration
Extended Topology Configuration
Configure HACMP Networks
Add a Network to the HACMP Cluster
15. 配置通讯接口
# smit hacmp
Extended Configuration
Extended Topology Configuration
Configure HACMP Communication Interfaces/Devices
Add Pre-defined Communication Interfaces and Devices
Communication Interfaces
net_ether_01
16. 添加一个持续的节点IP
# smit hacmp
Extended Configuration
Extended Topology Configuration
Configure HACMP Persistent Node IP Label/Addresses
Add a Persistent Node IP Label/Address
17. 设置心跳网络
# smit hacmp
Extended Configuration
Extended Topology Configuration
Configure HACMP Networks
Manage Two-Node Disk Heartbeat Networks
Add a Two-node Disk Heartbeat network
18. 测试心跳网络
Test a Two-node Disk Heartbeat network
19. 查看集群结构
# smit hacmp
Extended Configuration
Extended Topology Configuration
Show HACMP Topology
Show Cluster Topology
20. 配置服务IP
# smit hacmp
Extended Configuration
Extended Resource Configuration
HACMP Extended Resources Configuration
Configure HACMP Service IP Labels/Addresses
Add a Service IP Label/Address
Configurable on Multiple Nodes
net_ether_01 (10.10.20.0/24 10.10.10.0/24)
21. 配置服务
# smit hacmp
Extended Configuration
Extended Resource Configuration
HACMP Extended Resources Configuration
Configure HACMP Applications Servers
Configure HACMP Application Servers
Add an Application Server
22. 修改服务IP的分配偏好
# smit hacmp
Extended Configuration
Extended Resource Configuration
HACMP Extended Resources Configuration
Configure Resource Distribution Preferences
Configure Service IP Labels/Address Distribution Preference
net_ether_01
23. 配置扩展资源组
# smit hacmp
Extended Configuration
Extended Resource Configuration
HACMP Extended Resource Group Configuration
Add a Resource Group
24. 修改资源组属性
# smit hacmp
Extended Configuration
Extended Resource Configuration
HACMP Extended Resource Group Configuration
Change/Show Resources and Attributes for a Resource Group
ap
25. 同步资源组数据
先通过lspv命令查看两个节点的datavg状态是否为空,如果是active,则varyoffvg datavg。
#varyoffvg datavg
确认两个节点datavg均为空后,同步资源组数据
# smit hacmp
Extended Configuration
Extended Verification and Synchronization
到这里设置基本完成,用shutdown -Fr命令重启操作系统
26. 启动集群并查看运行状况
# smitty clstart
三、移除HA
1、 停止HA服务
smitty clstop
停止完成后通过netstat -in来验证服务IP(192.168.0.137)已经不在IP列表中
2、 删除HA拓扑结构
smit hacmp
Extended Configuration
Extended Topology Configuration
Configure HACMP Networks
Remove a Network from the HACMP Cluster
选择所有的项,移除
四、HA故障恢复后的重新同步
HA在出现故障,恢复完成后,需要进行重新同步。同步的步骤有两个:
1、 停止HA集群服务
Smit clstop
选择两个节点
完成操作。
2、 同步集群数据
smit hacmp
Extended Configuration
Extended Verification and Synchronization
3、 开启HA集群服务
Smitty clstart
确认后,集群开启完成。
--我做的原始文档是图文并茂的,可惜这边复制不过来图片,吐糟一个。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/30101733/viewspace-1415091/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/30101733/viewspace-1415091/