HA技术

高可用(HA,High Availability)集群通过一组计算机系统提供透明的冗余处理能力,从而实现不间断应用的目标。高可用集群是共同为客户机提供网络资源的一组计算 机系统,其中每一台提供服务的计算机称为节点(Node)。当一个节点不可用或者不能处理客户的请求时,该请求会及时转到另外的可用节点来处理,而这一过 程对于客户端是透明的,客户不必关心要使用资源的具体位置,集群系统会自动完成。HA集群是为了提高系统的可用性,以便在单个节点出现故障的时候,持续满 足用户的需求的集群系统。


HA集群系统构成主要包括主服务器(Master节点)、从服务器(Slave节点)、共享数据系统(SAN存储或数据同步系统)和心跳网络,HA 集群的容错备援过程主要包括故障侦测、自动切换和自动恢复,其工作方式主要分为主备方式、全活方式和N+M方式。主备(Active/Standby)方 式HA集群提供了最大的可用性,以及对性能的最小影响。该模型需要一个节点在正常工作时处于备用状态,主节点处理客户机的请求,而备用节点处于空闲状态。 当主节点出现故障时,备用节点会接管主节点的工作,继续为客户机提供服务,并且不会有任何性能上的影响。全活(Active/Active)HA集群是最 常用的集群模型,它提供了高可用性,并且在只有一个节点在线时提供可以接受的性能。该模型允许最大程度利用硬件资源,每个节点都通过网络对客户机提供资 源,每个节点的容量被定义好,使得性能达到最优,并且每个节点都可以在故障转移时临时接管另一个节点的工作。所有的服务在故障转移后仍保持可用,但是性能 通常都会下降。N+M模式HA集群系统由多个主节点、若干个从节点以及一些辅助设备(存储阵列、交换机)等组成,如图3所示。在实际应用中,一些用户并不 满足上述两种模式,认为“冗余设备”太多,需要多个主节点(N个)可以灾备到任意多个(M个)节点上。根据应用的级别,调整从节点的数量,可以为一个,也 可以为多个。主节点的数量可以为一个或者多个,根据应用需要随时调整搭配,但主节点为多个并不是同一个应用的“并行处理”,而是不同的应用。


图3:N+M HA集群工作模式