【论坛话题】两种容错方案的较量(图)

【网友问】 传统情况下做双机热备就可以了,容错服务器是不是可以用一台服务器起到双机热备系统的作用?两者比较差异在哪?

【IT168 网友解答】 目前主流应用的服务器容错技术有三类,它们分别是:服务器群集技术、双机热备份技术和单机容错技术。它们各自所对应的容错级别是从低到高的,也就是说服务器群集技术容错级别最低,而单机容错技术级别最高。由此可知它们各自应用的行业容错级别需求也是从低到高的。本文主要介绍后两种容错技术,先来看一下双机热备份容错技术。

一、双机热备份技术

双机热备份技术是一种软硬件结合的较高容错应用方案。该方案是由两台服务器系统和一个外接共享磁盘阵列柜(也可没有,而是在各自的服务器中采取RAID卡)及相应的双机热备份软件组成,如图1所示。

157318.jpg
图1(点击看大图)

在这个容错方案中,***作系统和应用程序安装在两台服务器的本地系统盘上,整个网络系统的数据是通过磁盘阵列集中管理和数据备份的。数据集中管理是通过双机热备份系统,将所有站点的数据直接从中央存储设备读取和存储,并由专业人员进行管理,极大地保护了数据的安全性和保密性。用户的数据存放在外接共享磁盘阵列中,在一台服务器出现故障时,备机主动替代主机工作,保证网络服务不间断。

双机热备份系统采用“心跳”方法保证主系统与备用系统的联系。所谓“心跳”,指的是主从系统之间相互按照一定的时间间隔发送通讯信号,表明各自系统当前的运行状态。一旦“心跳”信号表明主机系统发生故障,或者备用系统无法收到主机系统的“心跳” 信号,则系统的高可用性管理软件认为主机系统发生故障,主机停止工作,并将系统资源转移到备用系统上,备用系统将替代主机发挥作用,以保证网络服务运行不间断。

双机热备份方案中,根据两台服务器的工作方式可以有三种不同的工作模式,即:双机热备模式、双机互备模式和双机双工模式。下面分别予以简单介绍。

双机热备模式 即目前通常所说的active/standby 方式,active服务器处于工作状态;而standby 服务器处于监控准备状态,服务器数据包括数据库数据同时往两台或多台服务器写入(通常各服务器采用RAID磁盘阵列卡),保证数据的即时同步。当active服务器出现故障的时候,通过软件诊测或手工方式将standby机器激活,保证应用在短时间内完全恢复正常使用。典型应用在证券资金服务器或行情服务器。这是目前采用较多的一种模式,但由于另外一台服务器长期处于后备的状态,从计算资源方面考量,就存在一定的浪费。

双机互备模式 ,是两个相对独立的应用在两台机器同时运行,但彼此均设为备机,当某一台服务器出现故障时,另一台服务器可以在短时间内将故障服务器的应用接管过来,从而保证了应用的持续性,但对服务器的性能要求比较高。配置相对要好。

双机双工模式 :是目前cluster(群集)的一种形式,两台服务器均为活动,同时运行相同的应用,保证整体的性能,也实现了负载均衡和互为备份,需要利用磁盘柜存储技术(最好采用San方式)。WEB服务器或FTP服务器等用此种方式比较多。

二、单机容错技术

从上面的分析我们知道,双机热备份技术所采用的是两台配置完全一样的服务器系统,其实服务器群集方案中的容错技术也是一种多服务器容错技术。而本节所要介绍的单机容错技术则是在一台服务器实现高性能容错的,它的容错能力要远比服务器群集和双机热备份中容错能力要高,所以更加适合那些如证券、电信、金融、医疗等对容错能力特别苛刻的行业。

以往的集群系统在出现故障的情况下,需要中断服务器的运行,然后用一定的时间切换至备用的服务器上面进行运行,才能进行维修和恢复,这其中所付出的成本和带来的损失是用户最不愿意看到的。具有容错技术的容错服务器,最大的优势就在于它能够自动分离故障模块,在不中断运行的情况下,进行模块调换,对损坏的部件进行维护,并且在一切物理故障消除后,系统会自动重新同步运行,从而有效的解决了客户的后顾之忧。正因如此,具有容错技术的容错服务器,正在冲击前几年兴起的双机热备份和集群技术,越来越被人们所关注。同时,更为难得的是它可以在采用符合工业标准部件的服务器中实现(IA架构服务器),极具竞争力的成本优势,更使得容错服务器令人刮目相看。

容错服务器是通过CPU时钟锁频,通过对系统中所有硬件的备份,包括CPU、内存和I/O总线等的冗余备份;通过系统内所有冗余部件的同步运行,实现真正意义上的容错。系统任何部件的故障都不会造成系统停顿和数据丢失。目前很多容错系统是基于IA架构的服务器,与 Windows 2000完全兼容,实现以前只有在RISC系统上才能实现的容错。这种容错技术在IA服务器上的实现,将IA服务器的可***性提高到了99.999%,同时服务器的运行是不间断的。

双机热备份和容错服务器的定位稍微有些不同,这是由两者实现的可用性差别决定的。双机热备份一般可以实现99.9%的可用性,容错服务器却可以实现99.999%的可用性。这样,双机热备份大多应用在业务连续性不是很严格的行业,比如说公安系统、部队系统或者个别的制造企业,这些行业的应用允许数据有一小段时间的中断。而如电信、金融、证券和医疗等要求高的行业则是容错服务器的天下。还要注意的一点是双机热备份与服务器群集并不一样,双机热备份通常要求两对路服务器的配置完全一样,而服务器群集则没有这方面的严格要求,这也是许多读者容易混淆的。

另外,双机热备份方式由于需要至少2台服务器,导致在软件采购(***作系统、中间件、双机备份软件等)、软件维护升级、系统硬件升级都需要比单机容错方式多1倍的额外投入,而且在双机备份软件出现故障后,其维修的难度较高,对客户会带来较大困难。因此虽然单机容错服务器的硬件成本高于双机备份方式的硬件投入,而其总成本(TCO)却远远低于双机备份方式的成本。但是就其灵活配置方面,双机热备份方案更具优势,许多热备份方案都是由一些系统集成商组合不同厂家服务器产品进行的,可以满足不同客户需求。但总体来说,容错服务器是未来发展的趋势。

三、产品方案推荐

以上介绍两种当前最为主流的服务器容错技术,其实双机热备份并不是一类专门的服务器类型,可以说几乎所有的服务器都可以实现这样的方案,关键就在于是否有相应的热备份软件方案。在整个热备份方案中,负责整个系统管理的软件是关键,目前能开发出这种软件的厂商并不多见,通常一些服务器厂商所开发的热备份管理软件只是针对它们自己特定系列服务器而开发的,当然也有一些专门针对某类服务器开发热备份管理软件的软件公司,所以在实际应用中热备份方案中的服务器也不是随便组合的。而容错服务器则可作为单独一类服务器而存在,它是通过在一台服务器内部的多个关键部件冗余来实现高级容错的。下面各自介绍两个具体产品方案。

1. 双机热备份方案

(1)宝德Powerleader PL4400R服务器双机容错方案

宝德Powerleader PL4400R服务器(如图2所示)的这个双机热备份方案在业界是出尽了风头,因为它被我国风云一号卫星系统设计者――上海卫星工程研究所成功采用,如图3所示。

157324.jpg
图2(点击看大图)

157327.jpg
图3(点击看大图)

在上海卫星工程研究所的双机热备份方案中,采用了两台带RAID卡的Powerleader PL4400R服务器,其中每台服务器配有多个硬盘,用于安装各自的***作系统、数据库软件,应用软件和双机软件等(没有采用如图1所示的独立磁盘阵列柜)。两台服务器中,有一台用于承担日常的WWW、FTP、DNS、E-Mail、IP Masquerade等Internet应用(图3中称为“Primary Server”,主服务器),并对于各研究室之间的文件、数据、打印共享等提供支持,而另一台服务器作为硬盘数据镜像使用(图3中称为“Standby Server”,备用服务器)。当主服务器发生故障时,那么其上所运行的应用程序就将被备用服务器自动接管。如果不是服务器而是其中的一个应用服务发生故障,那么该应用服务也将被重新启动,或被由另一台服务器接管。在双机容错的保护下,数据基本可以做到不丢失、系统永不停机。

在这一方案中,两台Powerleader PL4400R服务器通过一条100M网络线相连,专门用于两台服务器的心跳检测、数据同步链路,不再占用客户机与服务器通信时的应用网卡资源。平时,主服务器处理作业和数据,发生故障后,备用服务器自动接管主服务器的作业和数据,同时自动接管主服务器的主机名(Host)及网络地址(IP),而客户(Client)可以继续运行,无需要重新启动机器。主服务器修复好以后,再将备用服务器上的作业和数据切换到主服务器,备用服务器又切换到备用等待状态。

(2)联志双机热备份方案

联志公司为了抢占中低档的容错市场,推出了Aisino系列服务器(如图4所示)双机热备份方案,声称这个全系列的服务器立品都可以配置双机热备份方案。

157334.jpg
图4(点击看大图)

Aisino系列服务器提供了对数据持续存取的附加支持。支持ROSE HA等几个业界领先的开放系统主机故障切换软件解决方案(软件方案是采用其它公司的产品)。主机故障切换允许一台备用主机在生产主机出现故障时,接管其上的存储和网络控制权,并重新启动运行在上面的应用服务。双机热备份网络结构参见图1所示。

在主机和磁盘阵列间的路径是一个潜在的单点故障,它可能会导致数据存取的完全丢失。其备用路径(Alternative Path)支持经由两条分离的路径存取同一个逻辑单元。若主路径出现故障,则通过备用路径重新启动I/O。使用路径切换软件,可使主机迅速地从接口故障中恢复过来,保证数据的可持续存取。

还有一种最常见的IBM i系列服务器热备份方案(它的热备份管理软件为VisionSuite),因篇幅的关系,在此就不能详细介绍了。下面简单介绍两款最新容错服务器。

2. 容错服务器

(1)HP NonStop服务器

HP NonStop是HP工业标准服务器系列产品中的高端产品,其专用性表现在它的核心容错结构,可进行全面的故障检测和隔离,以确保数据的完整性。整个系统无任何单点故障,其可用性达到99.999%,足以让最关键和复杂的应用得到满足。NonStop服务器的处理性能通过松散耦合的非共享体系结构得以线性方式进行扩展,可以从2个处理器扩充到4080个,其线性增长率达到98.8%,这些专用特点对用户来说大部分是透明的。2002年6月HP推出了新一代的S76/86系列容错服务器(如图5所示),NonStop S系列服务器将ServerNet互连体系结构与最新的 RISC处理技术相结合,提供了出色的性能价格比、突破性的I/O带宽和近乎无限的可扩展性,具有持续可用性、数据完整性、分布式交易处理和数据库、开放式网络及安全性等优势。

157337.jpg
图5(点击看大图)

NonStop S系列服务器可进行全面的故障检测和隔离,并保护数据的完整性。自检处理器和ServerNet路由器采用数据复制和比较逻辑来确保故障得到检测,并禁止故障组件,以防止错误传播。ServerNet技术能够避免适配器和控制器破坏内存,并确保正确传输数据和地址。

处理器多功能单元(PMF)上有两个带有比较逻辑的中央处理器单元(CPU)、两个二级高速缓存拷贝和一个主内存。PMF单元上的CPU以锁步方式运行,可执行本地高速缓存外的相同指令数据流。每个CPU的输出结果均与其它CPU的输出结果进行不间断地比较。如果它们不一致,***作系统将立即关闭处理器,以防止破坏数据。***作系统将故障记录在系统事件日志上,复杂的诊断软件会对问题进行分析。

NonStop S系列服务器使用包含备份进程的另一个PMF单元继续运行,而不会对应用造成任何影响。在配有两个或多个处理器的NonStop S系列服务器中,备份进程可以在该服务器的任何PMF中运行,从而使得故障处理器的工作负载可以分配到其它处理器上。

(2)NEC Express 5800/ft

NEC在容错服务器市场中处于领先地位,去年年底将其独有的Express 5800/ft双路Intel Xeon系列容错服务器(如图6所示)推向中国市场,该产品是将处理器、内存、硬盘及电源等所有主要组件均双重配置,实现容错。在同一时刻,双份的容错硬件部件处理相同的指令。在一个部件出现故障的情形下,故障部件自动分离,其冗余部件就像激活了的备份,继续正常***作。系统不会停机,也不会丢失数据。每一组双重配置的硬件均同时完成相同的过程,为银行、证券等有着特别苛刻需求的关键领域提供高等级的可***性。

157341.jpg
图6(点击看大图)

NEC Express 5800/ft服务器采用Intel Xeon 2.4G处理器,最大支持3GB的内存,采用能够自动修正内存比特级错误的ECC内存,实现卓越的处理性能。特别设有2套4个64位的PCI总线插槽、双千兆网卡,PCI模块的设计可连接多个PCI设备。经过机架优化设计,整个高度只有4 U,在一个42 U的19英寸机柜内可配置8台2路容错服务器,是空间有限的数据中心理想的平台选择,同时也为远程办事机构、多办事机构环境或分布式多场点应用,例如零售网点、银行分行、仓库等提供了灵活性和高性能,面向业务连续性、信息连续访问、交易完整性、应用可用性等基本需求的关键性处理和***作。

另外在产品的整体设计上,NEC系列容错服务器产品突出了一个令人信赖的质量和人性化的设计。比如NEC服务器上可以进行热插拔的器件都以绿色来表示;而需要停机后才可插拔的器件相应地以蓝色来表示,这种在服务器产品当中所具体运用的独特色调式管理,大大方便了用户对服务器的日常维护和使用。NEC服务器的散热板设计也是别俱匠心,有一个内部通道直接从外部引入空气直至CPU,从而有效减小了对服务器内部其他元件的耗损和干扰,保证了整个系统的稳定性。

小结:

在容错服务器市场中还有许多非常有名的品牌和机型,因篇幅关系,在此就不一一介绍了。通过对上的介绍,相信这位网友对什么是双机热备份和容错服务器有一个较全面的了解。它们虽然都属于服务器容错技术范畴,但因所采取的容错方式不同,导致最终的容错性能也不相同。容错服务器方案较双机热备份方案在容错级别上高些,因而它更适合于那些对容错更苛刻的行业应用。同时还请这位网友明白的一点就是,双机热备份方案是通过类似于服务器群集技术进行的,并不一种单独的服务器类型,理论上几乎所有服务器都可以实现这种容错方案,只需有相应的热备份软件方案。而容错服务器方案是在同一台服务器中进行的,可以作为一种独立的服务器类型。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值