什么是IBM Power Systems的地理分散弹性?
IBM®Power Systems™的地理分散弹性是一种创新的灾难恢复(DR)解决方案,于2016年发布,它为在IBMPOWER7®或IBM POWER8上运行的虚拟机(VM)的两个站点提供了简化且易于部署的灾难恢复解决方案。 ®基于处理器的服务器。 地理分散的弹性类似于VMware Site Recovery Manager和IBM zSystems®的IBMGDPS®解决方案,并且是GDPS灾难恢复解决方案系列的一部分。 由于应用程序和服务的灾难恢复是提供业务连续性的关键组件,因此IBM地理分散弹性解决方案可帮助客户在故障期间进行自动化的灾难恢复流程。
您可以在以下IBM developerWorks Wiki文档中了解有关Power Systems的地理分散弹性的更多信息: 为什么GDR是Power Systems和FAQ 的理想DR解决方案 。
控制系统(KSYS)是地理分散弹性解决方案的基本组件。 KSYS处理发现,监视,通知,恢复和验证方面。
初始配置完成后,KSYS节点将在活动站点和备份站点中发现所有由硬件管理控制台(HMC)管理的主机,并显示状态。 发现期间,KSYS节点监视选定站点内所有托管主机中所有逻辑分区(LPAR)或VM的发现。 KSYS节点收集每个LPAR的配置信息并显示状态。 KSYS节点发现每个VM的磁盘,并检查当前是否为存储设备镜像配置了VM。
站点发现完成后,KSYS节点将从HMC中获取信息,以检查备份站点在灾难期间是否能够托管VM。 KSYS节点还验证与存储复制相关的详细信息。
地理分散弹性解决方案支持计划内和计划外的灾难恢复方法。
- 计划的灾难恢复 :在计划的移动中,当没有灾难事件且生产站点中的资源可以正常关闭时,管理员将启动移动。 启动这些类型的操作主要是为了执行DR测试演练,从一个站点移动到另一个站点,或者当其中一个站点需要脱机进行维护时。 在计划的迁移中,自动清理将由称为KSYS节点的控制器系统进行处理。
- 计划外灾难恢复 :在计划外场景中,每当发生故障或自然灾害时,都会向管理员通知发生故障的灾难事件。 根据情况,管理员可以启动计划外的移动。 在计划外的迁移过程中,所有虚拟机都将突然关闭,并且生产站点上的虚拟机清理将不会由KSYS处理。 在这种情况下,管理员必须手动清理虚拟机。
本文中使用的关键术语
请参考下表以了解本文中使用的关键术语。
术语 | 描述 |
---|---|
网站1 | 是在特定时间运行工作负载的生产站点(例如,印度) |
网站2 | 是备份站点,在特定时间充当工作负载的备份(例如,奥斯汀) |
HMC 1_1 | 是站点1上的HMC |
HMC 2_1 | 是站点2上的HMC |
主机1_1 | 是站点1上的受管系统(主机/ CPC) |
主机2_1 | 是站点2上的受管系统(主机/ CPC) |
VIOS 1_1 | 是站点1上的主要VIOS |
VIOS 1_2 | 是站点1上的冗余VIOS |
VIOS 2_1 | 是站点2上的VIOS |
虚拟机1 | 是虚拟机 |
中央处理器组合(CPC) | 是硬件的物理集合,由主存储器,一个或多个中央处理器,计时器和通道组成 |
CG | 是存储阵列中基本卷的集合 |
知识系统 | 是一个控制系统,可为整个分散的电源系统弹性解决方案管理的整个环境提供单点控制 |
注意:我们使用EMC公司的VMAX存储和Symmetrix远程数据工具(SRDF)复制来演示本文。
问题陈述
最佳实践是,通常在生产环境中部署具有双虚拟I / O服务器(VIOS)配置的多路径,以实现冗余,更好的性能和维护VIOS的灵活性。 在这样的配置中,每个VM都有一个虚拟的光纤通道(FC)适配器,该适配器映射到每个VIOS。 通过多路径I / O,VM可以使用两条不同的路径访问存储磁盘,每条路径均由单独的VIOS提供。 但是,由于任何资源限制,可能无法始终部署双重VIOS配置。 在这种情况下,请考虑以下情况:主站点上的主机具有双重VIOS设置,而备份站点上的主机具有单一VIOS设置,如图1所示。
图1.具有两个VIOS的生产站点和具有单个VIOS的备份站点
图1中描述的环境在DR操作期间导致以下问题:
问题 。 在“地理分散的弹性”解决方案的验证阶段,KSYS管理器验证活动站点和备份站点上的主机是否具有相同的配置。 在这种环境下,由于VIOS配置不匹配,DR操作失败。
但是,如果在虚拟机的备份站点使用lose_vios_redundancy
属性(本文稍后进行了说明)以单个VIOS配置启动虚拟机,并且稍后在将虚拟机移回活动站点时,在主站点lose_vios_redundancy
丢失双VIOS配置。
使用Loss_vios_redundancy选项的地理分散弹性
ksysmgr
命令提供了lose_vios_redundancy
属性,以允许从源站点进行双重VIOS设置的VM恢复备份站点上仅具有单个VIOS实例的VM。 默认情况下,此属性设置为no
,这意味着在灾难恢复到备份站点期间会维护双VIOS设置。
该属性的值应设置为yes,以在备份站点由单个VIOS实例组成时允许DR操作,如图1所示。
# ksysmgr modify system lose_vios_redundancy=yes
在成功完成从站点1到站点2的灾难恢复操作之后,将lose_vios_redundancy
选项设置为yes,在站点2上,VM1的路径将映射到单个VIOS 2_1,如图2所示。
图2.从站点1到站点2的灾难恢复之后的路径映射
站点1恢复后,假设从站点2到站点1发起了DR操作。成功进行DR操作后,与站点2相似的VIOS配置将保留在站点1。即,VM1的路径将通过VIOS 1_1或VIOS 1_2进行映射,如图3所示。
图3.从站点2到站点1进行灾难恢复之后可能的路径映射
这表明,即使将VM1移回站点1,站点1的初始配置(即具有双重VIOS配置功能的多路径)也会丢失。这是本文讨论的问题。 这可能与生产环境有关。 因此,在本文中,我们提供了一种解决方案,可在灾难恢复操作后使用双VIOS保留多路径的原始配置。
在灾难恢复之后使用双VIOS配置保留多路径的过程
本节提供解决方案摘要的高级详细信息,以解决本文介绍的问题:
- 使用
lose_vios_redundancy
属性为DR操作做准备,以允许来自源站点的双VIOS设置中的VM恢复备份站点中仅具有单个VIOS实例的VM。 - 从站点1到站点2执行计划外的DR操作。这有助于避免在站点1上自动清除双重VIOS配置。
- 而不是从站点2到站点1进行DR操作,而是重新同步活动站点一致性组,修改配置参数,反转EMC磁盘镜像并激活站点1上的VM1配置文件。
注意 :建议不要在DR之后(即在站点2上)执行任何配置更改。 因为我们正在激活保存在生产站点(即站点1)上的VM配置文件。
在站点1具有双VIOS配置设置的VM
运行以下命令,检查VM1的路径信息(请参见图4)。
#hostname
#uname -L
#lscfg -vpl fcs0 | grep "Hardware location code"
#lscfg -vpl fcs1 | grep "Hardware location code"
#lspath | grep hdisk0
图4. VM从双VIOS访问SAN磁盘
在VIOS 1_1和VIOS 1_2上的lsmap -all -npiv
命令的输出显示,VM具有所需的映射,以分别具有来自每个VIOS的路径(请参见图5和图6)。
图5. VIOS 1_1上的虚拟FC映射
图6. VIOS 1_2上的虚拟FC映射
使用losy_vios_redundancy属性(值为yes)准备DR操作
您需要执行以下步骤,以使用值为yes
的lose_vios_redundancy
属性为灾难恢复操作做准备:
- 创建一个集群,并使用以下命令向其添加KSYS节点。
# ksysmgr add ksyscluster <cluster name> ksysnodes=<node name>
将CPC /主机,HMC和存储代理添加到两个站点。 配对两个每次点击费用。
有关
ksyscluster
更多信息,请参阅集群创建的详细步骤 。图7.在KSYS上联机集群
- 使用以下命令在站点1(例如,印度)上启动发现:
# ksysmgr -t discover site India
图8.印度站点上的发现
- 使用以下命令将
lose_vios_redundancy
属性修改为yes。# ksysmgr modify system lose_vios_redundancy=yes
图9.将lost_vios_redundancy属性设置为yes
- 使用以下命令启动灾难恢复之前,请在站点上执行验证检查。
# ksysmgr -t verify site India
图10. KSYS节点上的验证过程
- 使用以下命令在灾难恢复之后检查站点详细信息。
#ksysmgr q site
图11.活动和备份站点详细信息
使用以下命令检查站点ID。
#lsrsrc IBM.VMR_SITE
图12.两个站点的站点ID
使用以下命令检查
IBM.VMR_SITE
类属性(即ActiveSiteID
)。#lsrsrc -c IBM.VMR_SITE | grep ActiveSiteID
图13.活动站点ID
启动计划外的VM从站点1到站点2的迁移
需要执行以下步骤来启动计划外的VM从站点1迁移到站点2:
- 使用以下命令调用从活动站点到备份站点的计划外迁移,以避免自动清理站点1。
#ksysmgr move site from=India to=Austin dr_type=unplanned
图14.从站点1到站点2的意外迁移
- 确认DR操作是否成功。
- 确保在站点1上保留了VIOS配置。
灾难恢复后,站点1上HMC 1_1上的VM1处于未激活状态。 不会在计划外的DR中删除配置文件信息,因此,将保留VIOS配置。
图15. HMC 1_1上的VM状态
- 验证站点2的灾难恢复操作是否成功。
进行灾难恢复后, 站点2的 HMC 2_1上的VM1处于“ 运行”状态。
图16. HMC 2_1上的VM状态
- 运行以下命令以确认VM在灾难恢复之后具有双路径配置。
#lspath | grep hdisk0
图17. DR之后,VM1上的双路径磁盘
- 确保在灾难恢复之后磁盘正在获得多路径。
在VIOS2_1上,
# lsmap -all -npiv
命令的输出确认VM1具有来自VIOS2_1的所有路径。图18.当前活动站点(例如,Austin)上的虚拟光纤通道适配器映射
- 在灾难恢复之后检查活动站点ID。
图19. DR之后,活动站点ID更改为“ 2”
图20. DR之后的活动站点和备份站点
- 执行以下命令,查看灾难恢复后一致性组的状态。
# /usr/symcli/bin/symrdf -cg VMRDG_cluster1_India query -detail
-cg
指一致性组名称。图21. DR之后的一致性组状态
- 确保在站点1上保留了VIOS配置。
- DR之后,一致性组状态将为Failed over 。 在KSYS节点上,重新同步活动站点一致性组(在此示例中为VMRDG_cluster1_Austin ),以将状态更改为Consistent 。
使用以下命令重新同步一致性组。
# /opt/IBM/ksys/storages/EMC/resync_emc_srdf_cg -s 196800573 -e <any string> -g VMRDG_cluster1_Austin -i 10.40.0.209 -t <any number> -s Active site storage id. -e Eyecatcher. -g CG_Name. -i IP address. -t Thread id.
图22.重新同步一致性组
重新同步后,您可以使用以下命令检查一致性组的状态:
# /usr/symcli/bin/symrdf -cg VMRDG_cluster1_India query -detail
图23.重新同步复制后的一致性组状态
在站点1上保留VM的双VIOS配置的过程
您需要执行以下步骤来保留站点1上VM的双VIOS配置。
- 在站点2上停用VM1。
图24.站点2上VM1的状态
- 在KSYS节点上,使用以下命令将EMC复制从当前备份站点(站点2)更改为生产站点(站点1):
# /opt/IBM/ksys/storages/EMC/reverse_emc_srdf_cg -s 196800508 -e 5EoV6 -g VMRDG_cluster1_India -i 10.40.0.170 -t 892 -m UNPLAN
图25. CG的反向复制
在模拟器上反转复制或镜像后,使用以下命令显示一致性组的状态。
# /usr/symcli/bin/symrdf -cg VMRDG_cluster1_India query -detail
图26.反转复制后的一致性组状态
- 将活动站点ID修改为1。要在不使用
ksysmgr move
命令的情况下启动DR,我们可以使用以下命令将ActiveSiteID
修改为1,然后反转镜像路径。 再次进行灾难恢复后,这将保留站点1上的原始配置。# chrsrc -c IBM.VMR_SITE ActiveSiteID=1
图27.将资源属性ActiveSiteID更改为1
- 在站点1上激活VM1配置文件。
图28. HMC 1_1 GUI上站点1上VM1的状态
- 在站点2上调用清理。
以下命令清除站点2上的VM1配置。
#ksysmgr cleanup site <site name>
图29.站点2上的清理过程
结论
本文演示了使用生产站点上的双VIOS配置和备份站点上的单VIOS配置执行灾难恢复操作的过程。 它还说明了在生产现场使用双VIOS保留多路径原始配置的过程。