组成双机热备的方案主要的三种方式
基于共享存储(磁盘阵列)的方式
共享存储方式主要通过磁盘阵列提供切换后,对数据完整性和连续性的保障。用户数据一般会放在磁盘阵列上,当主机宕机后,备机继续从磁盘阵列上取得原有数据。如下图所示 这种方式因为使用一台存储设备,往往被业内人士称为磁盘单点故障。但一般来讲存储的安全性较高。所以如果忽略存储设备故障的情况下,这种方式也是业内采用最多的热备方式。全冗余(双机双存储)方式
基于单台存储的传统双机热备方式,确实存在存储单点故障的情况,为实现存储冗余,存储高可用也已经越来越多的被用户接受。我们从理解上可以看出,双机热备最早是为解决服务器的计划性停机与非计划性宕机的解决方案,但是我们无法实现存储的计划性停机与非计划性宕机带来的服务器停机,而存储作为双机热备中唯一存储数据的设备,它一旦发生故障往往会造成双机热备系统全面崩溃。 随着科技的进步,云存储,云计算发展,对于存储热备已经进入了成熟及快速发展阶段,双机热备也随着技术的进步,进入到了没有单点故障的全冗余双机热备方式。如图: 这种方式的特点在于: 1、存储之间的数据复制不经过网络,而是由存储之间进行复制。 2、两个存储之间的复制是完全实时的,不存在任何时间延时。 3、主备存储之间的切换时间小于500ms,以确保系统存储时不产生延时。 4、硬盘盘符及分区不因为主备存储之间的切换而改变。 5、服务器的切换,不影响存储之间的初始化,增量同步及数据复制。 6、某一存储设备的计划性停机,不影响整个服务器双机热备系统的工作。 7、存储设备之间使用重复数据删除技术,完成增量同步工作。 8、真正的7X24小时或切换的全冗余方案。基于数据复制的方式
这种方式主要利用数据的同步方式,保证主备服务器的数据一致性。 基于数据复制的方式有多种方法,其性能和安全也不尽相同,其主要方法有以下几种: A、单纯的文件方式的考贝不适用于数据库等应用,因为打开的文件是不能被复制的,如果要复制必须将数据库关闭,这显然是不可以的。以文件方式的复制主要适用于WEB页的更新,FTP上传应用,对主备机数据完整性,连续性要求不高的情况下使用。 B、利用数据库所带有复制功能,比如SQLServer2000或2005所带的定阅复制,这种方式用户要根据自己的应用小心使用,原因主要是: (1)SQLServer的定阅复制会在用户表上增加字段,对那些 应用软件编程要求较高,如果在应用软件端书写时未明确指定字段的用户,而使用此功能会造成 应用程序无法正常工作。 (2)数据滞留,这个限制怕也是最要命的,因为SQLServer在数据传输过程中数据并非实时的到达主备机,而是数据先写到主机,再写到备机,如此一来,备机的数据往往来不及更新,此时如果发生切换,备机的数据将不完整,也不连续,如果用户发现已写入的数据在备机找不到,重新写入的话,则主机修复后,就会发生主备机数据严重冲突,数据库会乱掉。 (3)复杂应用切莫使用定阅复制来做双机热备,包括 数据结构中存储过程的处理,触发器和序列,一旦发生冲突,修改起来非常麻烦。 (4)服务器性能降低,对于大一点的数据库,SQLServer2000或2005所带的定阅复制会造成服务器数据库运行缓慢。 总之SQLServer2000或2005所带的 定阅复制主要还是应用于数据快照服务,切莫用他来做双机热备中的 数据同步。 C:硬盘数据拦截,目前国际国内,比较成熟的 双机热备软件通常会使用硬盘数据拦截的技术,通常称为 镜像软件即Mirror软件,这种技术当前已非常成熟,拦截的方式也不尽相同。 (1)分区拦截技术,以Pluswell热备份产品为例,他采用的是一种分区硬盘扇区拦截的技术,通过驱动级的拦截方式,将数据写往硬盘的数据提取,并着先写到备用服务器,以保证备用服务器的数据最新,然后再将数据回写到主机硬盘。这种方式将绝对保证,主备机数据库的数据完全一致,无论发生哪种切换,都能保证数据库的完整性与连续性。由于采用分区拦截技术,所以用户可以根据需要在一块硬盘上划分适合大小的分区来完成数据同步工作。 (2)硬盘拦截技术,以Symantec的Co-Standby为例,也是一种有效的硬盘拦截软件,他的拦截主要基于一整块硬盘,往往在硬盘初始化时需要消耗大量的时间。双机热备中需要指出的几个概念
双机热备的工作原理即
故障隔离,简单的讲,高可用(热备)就是一种利用故障点转移的方式来保障业务连续性。其业务的恢复不是在原服务器,而是在备用服务器。热备不具有修复故障服务器的功能,而只是将故障隔离。Active-Active方式指的是业务
Active-Active方式指的是业务方式而不是服务器状态,如果是 同一种应用是不能完成Active-Active方式的。例如热备的两台服务器都是sqlserver数据库,那也是指的不同的数据库实例。相同的数据库实例是不可能在热备这一级实现Active-Active方式。简单的讲Active-Active方式就是两个Active-Standby方式分别运行于两台服务器上的。故障检测
故障检测是双机热备的任务,不同的双机检测点的多少决定了双机热备软件在功能和性能上的优劣,并不是所有的软件都具有相同的检测功能,以PlusWell双机热备软件为例,其提供的是一种全系统检测能力,即检测分为系统级、应用级、网络级三个方面。系统级检测主要通过双机热备软件之间的心跳提供系统的检测功能,应用级提供用户应用程序、数据库等的检测功能,网络级的检测提供对网卡的检测及可选的对网络路径的检测功能,因此称为全故障检测能力。服务器资源
双机热备的资源指某种业务运行过程中所依赖的最小的关联服务,不同的双机软件所提供的资源多少也不相同,当然提供的可切换资源越多,软件应用的范围也越广,在双机热备中提到的服务器资源主要包括,可切换的网络IP资源、计算机名、磁盘卷资源、服务器进程等。双机热备的切换
双机热备的切换一般分为手动切换和故障切换,即计划性切换(即人为切换)和非计划性切换(即故障切换)。需要大家注意的是并不是所有资源都具有可切换性,以PlusWell热备份软件为例他提供了:(1)本地资源监控,即不可切换的资源,(2)普通资源,即可以在主备机切换的资源。(3)快速资源,指的是快速切换的资源, 一般情况下的双机切换时间为1-5分钟,而快速切换的时间为3-5秒种。用户应根据自己的需求及业务特点来选择相关的切换服务,从 价格成本上来说,切换的时间越短费用也越高。热备份与备份的概念区别
热备份指的是:high available即高可用,而备份指的是Backup,即 数据备份的一种,这是两种不同的概念,应对的产品也是两种功能上完全不同的产品。热备份主要保障业务的连续性,实现的方法是故障点的转移,而备份,主要目的是为了防止数据丢失,而做的一份拷贝,所以备份强调的是 数据恢复而不是应用的故障转移。国外产品
微软MSCS Symantec VCS Legato NEC Express Cluster LifeKeeper EMC Autostart 红帽RHCS国内产品
ROSE:双机产品 PlusWell 集群软件 Lander Cluster集群软件 EterneCluster集群软件