IBMPowerHA®SystemMirror V7集群软件是IBMAIX®集群的下一版。 为了提供与AIX操作系统的更紧密的集成,开发了一个新的内核级别层,称为Cluster Aware AIX(CAA)。 群集软件利用这种新的基础进行心跳和消息通信。 在内核级别运行可确保群集通信获得最高优先级,并且在发生内存泄漏或恶意应用程序占用系统资源的情况下不会受到影响。 通过这种重新设计,可以跨所有网络接口进行运行状况监视,并具有从外部存储区域网络(SAN)存储柜启动时对根卷组(rootvg)丢失做出React的能力。 此外,光纤通道(FC)适配器中的新目标模式功能允许进行新的存储框架通信,以通过SAN进行运行状况监视。 以下说明旨在帮助您利用新的clmgr
CLI快速部署PowerHA SystemMirror V7集群。 它们还提供了常见管理任务,示例配置文件和有用日志的示例。
最低先决条件
PowerHA SystemMirror版本 | 一般可用 | 最低AIX级别 |
---|---|---|
PowerHA SM版本7.1.0 | 2010年9月 | 带有RSCT 3.1.0.1的AIX 7.1 带有RSCT 3.1.0.1的AIX 6.1 TL6 SP1 |
PowerHA SM版本7.1.1 | 2011年12月 | 带有RSCT 3.1.2.0的AIX 7.1 TL1 SP3 带有RSCT 3.1.2.0的AIX 6.1 TL7 SP3 |
PowerHA SM版本7.1.2 | 2012年11月 | 带有RSCT 3.1.2.0的AIX 7.1 TL2 SP1 带有RSCT 3.1.2.0的AIX 6.1 TL8 SP3 |
PowerHA SM版本7.1.3 | 2013年12月 | 带有RSCT 3.1.5.0的AIX 7.1 TL3 SP1 带有RSCT 3.1.5.0的AIX 6.1 TL9 SP1 |
- CAA功能所需的软件包包括:
- bos.cluster.rte
- Bos.ahafs
- bos.cluster.solid(在HA 7.1.0之后不再需要)
- 版本7群集中的所有共享卷组(VG)必须是企业并行模式(ECM)VG:
- bos.clvm.enh
群集资源清单
- IP地址规划
- 请求IP(引导/基本IP,永久IP和服务IP的数量)。
- 注册域名服务器(DNS)名称。
- 更新配置文件:/ etc / hosts / etc / cluster / rhosts。
- 接口上的硬IP。
- 共享存储计划
- 确定空间要求[数据逻辑单元号(LUN)和集群存储库磁盘的数量]
- 确定驱动程序和多路径要求
- 定义LUN映射
- 创建SAN区域
- 创建或导入共享卷组,逻辑卷和文件系统信息
- 对跨集群成员导入的资源使用唯一的名称
- 高度可用的应用程序规划
- 确定安装位置和空间要求。
- 识别用户和权限设置。
- 测试和部署应用程序启动和停止脚本。
- (可选)测试和部署应用程序监视脚本。
- PowerHA SystemMirror集群部署:
- 识别并在所有节点上安装AIX级别要求[包括CAA和可靠的可伸缩集群技术(RSCT)软件包]。
- 在所有节点上标识并安装所需的PowerHA SystemMirror代码级别。
- 重新启动逻辑分区(LPAR)以获取内核Bos更新
- 从节点1:
- 定义集群名称
- 定义集群存储库磁盘
- 定义多播地址(自动或手动)
- 定义节点名称
- 定义网络
- 定义接口
- 定义应用程序控制器
- 定义服务IP
- 定义资源组
- 为资源组定义资源
- 验证并同步集群。
- 在所有节点上启动群集服务。
配置完成并同步后,您可以继续执行以下任务:
- 故障转移测试:与重新启动–q(硬)相比,通过接管和资源组移动(软)平稳停止。
- 监控环境。
- 配置文件:
- / etc / hosts:此文件的内容应包括所有群集IP地址及其相应的IP标签,因为最好让群集在本地解析,然后在必要时还原为DNS。
- / etc / cluster / rhosts:在两个节点上填充文件,然后刷新集群通信守护程序。 (
refresh –s clcomd
)。 在每行中明确定义的群集IP有助于避免名称解析问题。 确保在此文件中仅定义有效的可访问群集IP。 - /usr/es/sbin/cluster/netmon.cf:单个适配器网络中的集群使用此文件来尝试在发生故障时确定适配器状态。 虚拟化环境应部署此文件以指向位于物理框架外部的默认网关或IP,以验证外部连接性。
- IP地址:
- 组播地址(自动或手动分配):版本7集群上的集群心跳使用IP组播,默认情况下,在集群创建过程中分配组播地址。 它通过根据在网络接口上检测到的第一个IP定义一个地址来尝试避免在群集之间重复(例如,en0 – 9.10.10.1基本IP可能会导致228.10.10.1多播地址)。 如果您想定义自己的多播地址,也可以在集群配置的该部分中进行定义。 此默认值在版本7.1.3中改回为单播通信,但是IP多播仍然是可用的选项。
- 基本IP地址:AIX中的每个适配器通常在其ODM上都存储有一个IP地址,并设置为在系统引导过程中联机。 如果这些适配器要在PowerHA网络中,则可以在集群定义中将它们定义为基础/引导适配器。 请注意,除非管理员在PowerHA 专用网络中明确定义了它们,否则CAA都会尝试使用LPAR中的所有接口。 具有将承载潜在服务IP的接口的虚拟局域网(VLAN)必须启用IP多播。 否则,CAA会将这些接口视为关闭状态,并且从不尝试在其上获取服务IP别名。
- 永久IP:这是特定于群集节点的别名,无论HA服务是否在运行,它都将在系统启动时可用。 这些可以用作每个节点的管理IP,也可以用作群集故障转移时用于保存可路由子网路由的IP。 一段时间以来,PowerHA允许单个适配器网络在同一可路由子网上定义基本/引导IP和服务IP。 因此,对持久性IP的需求不像早期版本那样普遍,因此,通常不需要这些。
- 服务IP:任何定义的服务IP地址别名都将由群集管理,只要它们在资源组中定义即可。 根据资源组及其对应资源的托管位置,将确定服务IP别名的位置
- 共享磁盘:
- CAA存储库磁盘(大小要求:最小512 MB和最大460 GB):这是新的CAA要求,必须对所有集群成员可见。 通常的做法是将此LUN定义为环境中的标准LUN大小,只要它在最小和最大大小要求之内即可。 在第一次验证和同步操作时,群集在设备上创建一个私有卷组。
- 共享数据卷:必须创建所有群集管理的共享卷组,或者将其转换为增强的并发模式,然后进行映射,然后将其导入所有群集节点。 应将相应的LUN定义为在其后端多路径驱动程序中未设置保留。 在群集处理期间,群集使用其自己的磁盘防护寄存器来管理设备,并且仅允许将文件系统安装在托管资源组的节点上。
- 群集资源组策略:
- 群集配置中的资源组是不同高可用性资源的容器。 在规划阶段应建立不同的资源组启动,故障转移和回退策略,并应充分理解。
资源组策略
资源组策略 | 可用选项 |
---|---|
启动政策 |
|
失败转移政策 |
|
后备政策 |
|
- 集群应用程序(应用程序控制器定义)
- 启动/停止脚本:应用程序控制器脚本必须位于所有参与群集成员的公共路径中。 它们还必须由root用户可执行。 脚本的内容不需要在所有集群成员之间都匹配。 但是,如果内容需要根据应用程序要求进行匹配,则可以使用PowerHA文件收集功能来确保每10分钟自动复制一次更改。
- (可选)应用程序监视脚本:群集软件提供了可在任何部署中使用的可选应用程序监视框架。 集群为在托管其资源组和相应应用程序控制器的节点上定义的每个监视器运行clappmon进程。 任何监视脚本都应可以由root用户执行,经过全面测试,具有适当的脚本终止功能,并且应位于所有群集成员的公共位置。
CAA心跳通讯
- 存储库磁盘版本7群集通信要求使用共享的LUN(存储库磁盘)进行心跳并存储群集配置信息。 7.1.1和7.1.2发行版的大小要求为最小大小为512 MB,最大为460 GB。 客户端通常使用其标准LUN大小而不是指定小于其当前数据LUN的卷。
- IP接口:版本7群集使用的新通信协议要求在支持网络接口的第2层设备上启用IP多播。 CAA默认情况下使用系统上的所有接口,除非它们被定义为高度可用的专用网络。 群集需要IP网络定义才能在群集成员之间执行IP地址接管。 如果多播通信不起作用,群集将不会在接口上使服务IP别名联机,因为该接口将被视为不可用。
- (可选)存储框架通信[SANCOMM]:在版本7群集中,基于SAN的通信是附加的检测信号选项。 如果正确启用,则存储框架通信将在共享SAN环境中的光纤通道适配器之间传递心跳,以提供其他心跳通信路径。 此配置仅在SAS或4 GB和8 GB光纤通道适配器上受支持,并且可以在专用主机总线适配器(HBA)或使用虚拟小型计算机系统接口(VSCSI)或N端口ID虚拟化(NPIV)的虚拟化适配器中使用。 在支持的HBA上,必须在拥有卡的LPAR上启用目标模式,并确保SAN分区提供所有集群成员上所有适用适配器之间的可见性。
chdev –l fscsi# -a dyntrk=yes –a fc_err_recov=fast_fail –P
chdev –l fcs# -a tme=yes –P (reboot is required)
注意 –P
仅在HBA上存在子设备时才用于更新AIX ODM,因此为什么需要重新引导才能使设置生效。
虚拟化环境要求在客户端LPAR和相应的虚拟I / O服务器(VIOS)实例之间使用保留的以太网VLAN(3358)。 必须在客户端LPAR和VIOS上定义虚拟以太网适配器,以创建允许SAN心跳通信到达VIOS实例上的物理HBA的桥。 虚拟以太网适配器不需要在其上定义IP地址。 为了使存储数据包在跨物理服务器框架定义的群集成员之间传递,SAN分区必须包括所有对应的HBA全球端口号(WWPN)。 在虚拟化环境中,需要在同一SAN区域中定义每个VIOS中HBA的物理WWPN(而不是客户端虚拟WWPN)。 查看当前的在线文档或最新的红皮书出版物,以获取使用此功能的示例。
CLI快速部署说明
可以完全通过新的CLI创建PowerHA SystemMirror V7集群。 在此示例中,IP已经被附加到/ etc / hosts文件中。 该卷组已经导入到所有集群成员中,并且已经编写了应用程序脚本并将其传播到每个集群节点中的公共/ usr / local / hascripts目录。 以下说明创建一个基本的两节点群集:
集群拓扑配置
网络 | 标签 | 功能 | 接口 | 节点 |
---|---|---|---|---|
net_ether_01 | Nodeb_base1 | 开机 | en0 | 节点A |
net_ether_01 | Nodeb_base1 | 开机 | en0 | 节点B |
net_ether_01 | 共享IP | 服务 | 别名 | 共享 |