clip_image001[4]

高用性(HA)与VMwareHA的理解

1. 通用HA(高可用性)群集基础理论

高可用性(HA)集群是群集的一种,平日较常见的为MSCS(微软群集服务),如SQL的故障转移群集。

高可用性群集,一般有两个或两个以上的节点,且分为活动节点及备用节点。通常把正在执行业务的称为活动节点,而作为活动节点的一个备份的则称为备用节点。当活动节点出现问题,导致正在运行的业务(任务)不能正常运行时,备用节点此时就会侦测到,并立即接续活动节点来执行业务。从而实现业务的不中断或短暂中断(对客户端来说,基本上感觉不到故障的存在)。

高可用性群集的实现是基于资源切换来进行的。这些资源包括节点的IP地址、主机名(NetBios名称)、磁盘卷、应用程序等。而资源的监控和接续,是依靠HA软件来实现的如MSCS等,这些软件用来通过"心跳信号"监控群集中对方节点的运行状态,一旦发现对方存在了故障,就会强制将所有的资源据为已有并继续对外提供服务。

VMwareHA也是高可用性的一种应用。VMware HA 与传统的群集和高可用性解决方案都支持主机发生故障时的自动恢复。它们是互为补充的,但是在软硬件要求、恢复时间及应用程序和操作系统的识别程度等方面有所不同。

 

2.HAVMotion的区别

 

在使用VMotion的时候通常是计划中的停机,我们可以在第一台ESX_01停机之前就先使用VMotion来转移虚拟机。但当系统宕机时,根本没有时间做VMotion,此时就是HA启动的时机,因此HA的使用时机也就在单一ESX服务器出现无预期故障的时候,就不得实现的高可用性。

 

3. VMwareHADRSVMotion相互关系

 

VMware VMotion是能够将虚拟机动态地在不同的物理主机(ESX主机)之间迁移的技术

VMware HA利用了vmotion技术,能够在虚拟机失效,或是ESX主机发生错误时,实时地迁移至还存活的ESX主机上继续执行。

VMware DRSVMotionHA技术融合在一起,根据ESX主机的CPU或内存资源负载,动态地迁移虚拟机至较负载较轻的ESX主机上,期间可以利用DRS建议,把一台ESX主机的上多个虚拟机放置在不同ESX主机上。

 

4. VMWare HA 的工作方式

 

VMware HA 可以将虚拟机及其所驻留的主机集中在群集内,从而为虚拟机提供高可用性。群集中的主机均会受到监控,如果发生故障,故障主机上的虚拟机将在备用主机上重新启动。

 

6.VMwareHA实验过程中的心得

 

AHA是针对安装有ESX主机的硬件的,在ESX主机故障后,虚拟机在其它主机恢复时使用了VMotion技术。但VMotion则是针对虚拟机的。(参考3VMwareHADRSVMotion相互关系)

BHA实现过程也就是虚拟机故障恢后在其它主机的过程中,虚拟机对外的服务会中断,但是时间相对较短罢了。这和VMotion上也有不同之处。

C、所有的虚拟机硬盘文件等必需要放在共享存储上。

D、需要使用到DNSHOSTS服务。

EESX主机在同一子网内,如果有多个网段,要确保ESX主机上有足够的网卡去连接。

附:

VMware HA 提供快速中断恢复

 

VMware HA 通过以下两种方式保护应用程序可用性

1.       通过在群集内的其他主机上自动重新启动虚拟机,防止服务器故障。

2.       通过持续监控虚拟机并在检测到故障时对其进行重新设置,防止应用程序故障。

 

与其他群集解决方案不同,VMware HA 提供基础架构并使用该基础架构保护所有工作负载:

 

1.       不需要在应用程序或虚拟机内安装任何特殊软件。所有工作负载均受 VMware HA 保护。配置 VMware HA之后,不需要执行操作即可保护新虚拟机。它们会自动受到保护。

2.       VMware HA VMware Distributed Resource Scheduler (DRS) 结合使用,不仅可以防止故障发生,而且可以在群集内的主机之间提供负载平衡。

 

VMware HA 接入控制

1>.vCenter Server 使用接入控制来确保群集内具有足够的资源,以便提供故障切换保护并确保考虑虚拟机资源预留。

 

包括 VMware HA 在内,有三种接入控制类型。

主机

确保主机有足够资源来满足其上运行的所有虚拟机的预留。

资源池

确保资源池有足够资源来满足与其关联的所有虚拟机的预留、份额和限制。

VMware HA

确保预留了足够的群集资源,以便在主机发生故障时恢复虚拟机。

 

 

2>使用“群集允许的主机故障数目”策略的接入控制示例

clip_image002[4]

 1 比较虚拟机的 CPU 和内存要求,然后选择最大值,从而计算出插槽大小。

最大 CPU 要求(由 VM1 VM2 共享)为 2 GHz,而最大内存要求(针对 VM3)为 2 GB。根据上述情况,

插槽大小为 2 GHz CPU 2 GB 内存。

2 由此可确定每台主机可以支持的最大插槽数目。

H1 可以支持四个插槽。H2 可以支持三个插槽(取 9 GHz/2 GHz CPU 6 GB/2 GB 内存中较小的一个),H3

也可以支持三个插槽。

3 计算出当前故障切换容量。

最大的主机是 H1,如果它发生故障,群集内还有六个插槽,足够供所有五个已启动的虚拟机使用。如果 H1

H2 都发生故障,群集内将仅剩下三个插槽,这是不够用的。因此,当前故障切换容量为 1

 

用于 VMware HA 通信的网络

 

1.       群集范围的网络注意事项

 

为了使 VMware HA 运行,群集内的所有主机都必须有兼容网络。添加到群集的第一个节点指明为了使所有后续主机成为群集成员还必须拥有的网络。如:

如果添加到群集的第一个主机有两个网络用于 VMware HA 通信,10.10.135.0/255.255.255.0 10.17.142.0/255.255.255.0,则所有后续主机必须配置相同的两个网络,并用于 VMware HA 通信。

2.       网络隔离地址

网络隔离地址是要 ping IP 地址,以确定主机是否与网络隔离。只有当主机已停止从群集内的任何其他主机接收检测信号时才 ping 此地址。如果主机可以 ping 其网络隔离地址,则说明该主机并未与网络隔离,并且群集内的其他主机已发生故障。但是,如果主机无法 ping 其隔离地址,则可能该主机已与网络隔离,并且不会执行故障切换操作。

 

3.       其他网络注意事项

 

主机防火墙。在 ESX/ESXi 主机上,VMware HA 需要并自动打开以下防火墙端口。

入站端口:TCP/UDP 8042-8045

出站端口:TCP/UDP 2050-2250

 

主机隔离响应

 

要使用“关机”设置,必须在虚拟机的客户机操作系统中安装 VMware Tools。将虚拟机关机的优点在于可以保留其状况。此操作优于关闭操作,关闭操作不会将最近的更改刷新到磁盘中,也不会提交事务。在关机完成时,已关机的虚拟机需要更长时间进行故障切换。未在 300 秒内或在高级属性 das.isolationShutdownTimeout 中指定的秒数内关机的虚拟机将被关闭。

 

主机代理

vCenter Server代理作为“迷你型”的vCenter Server使用,执行以下功能:

 

1、转发并执行由vCenter Server指定的资源分配决定(包括由DRS引擎发送的决定)。

 

2、将虚拟机置备和配置更改命令传递给主机代理。

 

3、将主机配置更改命令传递给主机代理。

 

4、从主机代理收集性能统计信息、警报和错误状况,并将其发送给vCenter Server

 

5、允许管理不同发行版本的ESX/ESXi主机。

 

主机配置文件

 

创建配置文件向导会提示,如图所示。选择该选项中的创建配置文件(Create profile)。如果你有任何备份配置文件,应当能够导入。主机配置文件的文件后缀名应当是.vpf

 

VirtualCenter HA设定多冗余隔离响应网络

方法一:

isolation网络对于VirtualCenter中的HA重要性不言而喻,它直接关系到VCHA的成败,那么,最大限度保障隔离响应的成功就显得异常重要,我们可以通过如下方式完成配置冗余隔离响应网络:

1、找到HA群集然后右击“Edit Settings”;

2、在打开的对话框中找到“Advanced Options”;

3、找到关于HA的高级参数配置界面,然后输入以下内容:

das.isolationaddress1=ip

das.isolationaddress2=ip

说明:这里可以配置到das.isolationaddress10

4、注意,完成这个内容之后,还需要禁止缺省网关地址:

das.isolationaddress=False

5、点击OK完成设置之后,重新激活HA群集,之后就生效完成。

clip_image004[4]

方法二:

添加与原来不同物理网卡的service console;双网卡组成team 就可以消除了;