【导读】:为了提高服务器的可靠性,一般会选用双机热备或者采用容错服务器。在很多方面,容错服务器的优势明显大于双机热备的方式。对于双机热备与容错服务器的差别及各自的优缺点,我们在这边文章中将做详细的解读。同时,也欢迎大家积极参与讨论,踊跃发表自己的看法和意见。
1、性能对比
从硬件配置和性能测试来看,容错服务器和单台同配置的服务器性能没有差别,并不会因为容错而导致任何的性能下降,因为容错服务器是 完全依靠硬件保障可靠性的,并不需要系统资源完成故障切换和监控。
2、可靠性对比
双机热备系统可靠性达到99.9%,而容错系统的可靠性能够达到99.999%,也就是说全年的停机时间从8小时降到5分钟。 双机热备虽然是两台硬件冗余,但是同时又引进了双机软件,使整个系统的可靠性并不能理解成为两套硬件对系统的可靠性保障。而且,由于双机热备系统维护过程中对使用者技术的要求,往往在系统故障时会因为使用过程中双机或者应用系统的配置变化而导致无法故障切换,存在较大风险。 而容错系统采用的是硬件检测和切换故障,不引进任何额外的软件,对于使用者来说是单一的系统,不会因为维护过程影响系统的可靠性保障。
3、可用性对比
容错系统对使用者来说完全是单一系统,对于操作系统以上的应用完全透明,应用不需要做任何更改,维护不需要额外的技术背景。
双机热备要求维护人员有较深的双机技术背景,安装实施复杂。双机系统对应用的支持需要额外的投入,比如对数据库系统和其他一些标准应用,用户需要购买相应的Agent才能支持对该应用的故障切换,对于非标准的应用(软件开发时没有事先考虑留好接口)双机软件不能支持故障切换。而且实现切换也需要做较复杂的配置和脚本调试。
4、故障切换对比
双机热备的故障切换是当主机出现故障时,在Standby机器上重新启动所有的应用,这样必然导致用户当前任务的丢失。也就是说客户端当前进行的操作将终止,所进行的业务需要从头开始。一方面造成客户应用的停止,另一方面将给后台系统造成一些不必要的麻烦比如垃圾数据。而且由于所有应用都需要重新启动,切换时间最少在1分钟以上。
容错系统当出现故障时,由于Cache、内存和硬盘的数据是完全同步的,而且两套系统是同时工作的,所以切换只需要把输出从故障部分转移到正常部分即可。当前的任务无需终止,完全无缝地切换过去,几乎不用切换时间(应用完全感觉不出来)。
5、成本对比
以一套两路服务器系统运行Oracle数据库应用(其他应用同样存在相同的成本问题)来对比两种系统的成本如下,不难看出总体考虑容错系统相对双机系统有较大的成本优势,而且双机系统还没有考虑系统后续的实施和维护成本。
(1)容错系统:总计64万元
一套两路容错系统 大约35万元
一套操作系统 大约4万元
一套Oracle数据库 大约25万元
(2)双机热备系统:总计86万元(含1年维护)
两台两路服务器 大约10万元
一套SCSI磁盘阵列 大约8万元
两套操作系统 大约8万元
两套Oracle数据库 大约50万元
一套双机软件 大约5万元
维护费用 大约5万元/年
6、投标指标
(1)可靠性要求达到99.999%,全年平均停机时间5分钟;
(2)全冗余方案设计,故障切换时间小于3秒;
(3)对应用软件透明,支持所有的用户应用软件;
(4)故障切换时客户端不需要重新连接,当前任务不需要重新开始;
(5)便于维护和管理,使用人员不需要专门的维护技术基础。
1、性能对比
从硬件配置和性能测试来看,容错服务器和单台同配置的服务器性能没有差别,并不会因为容错而导致任何的性能下降,因为容错服务器是 完全依靠硬件保障可靠性的,并不需要系统资源完成故障切换和监控。
2、可靠性对比
双机热备系统可靠性达到99.9%,而容错系统的可靠性能够达到99.999%,也就是说全年的停机时间从8小时降到5分钟。 双机热备虽然是两台硬件冗余,但是同时又引进了双机软件,使整个系统的可靠性并不能理解成为两套硬件对系统的可靠性保障。而且,由于双机热备系统维护过程中对使用者技术的要求,往往在系统故障时会因为使用过程中双机或者应用系统的配置变化而导致无法故障切换,存在较大风险。 而容错系统采用的是硬件检测和切换故障,不引进任何额外的软件,对于使用者来说是单一的系统,不会因为维护过程影响系统的可靠性保障。
3、可用性对比
容错系统对使用者来说完全是单一系统,对于操作系统以上的应用完全透明,应用不需要做任何更改,维护不需要额外的技术背景。
双机热备要求维护人员有较深的双机技术背景,安装实施复杂。双机系统对应用的支持需要额外的投入,比如对数据库系统和其他一些标准应用,用户需要购买相应的Agent才能支持对该应用的故障切换,对于非标准的应用(软件开发时没有事先考虑留好接口)双机软件不能支持故障切换。而且实现切换也需要做较复杂的配置和脚本调试。
4、故障切换对比
双机热备的故障切换是当主机出现故障时,在Standby机器上重新启动所有的应用,这样必然导致用户当前任务的丢失。也就是说客户端当前进行的操作将终止,所进行的业务需要从头开始。一方面造成客户应用的停止,另一方面将给后台系统造成一些不必要的麻烦比如垃圾数据。而且由于所有应用都需要重新启动,切换时间最少在1分钟以上。
容错系统当出现故障时,由于Cache、内存和硬盘的数据是完全同步的,而且两套系统是同时工作的,所以切换只需要把输出从故障部分转移到正常部分即可。当前的任务无需终止,完全无缝地切换过去,几乎不用切换时间(应用完全感觉不出来)。
5、成本对比
以一套两路服务器系统运行Oracle数据库应用(其他应用同样存在相同的成本问题)来对比两种系统的成本如下,不难看出总体考虑容错系统相对双机系统有较大的成本优势,而且双机系统还没有考虑系统后续的实施和维护成本。
(1)容错系统:总计64万元
一套两路容错系统 大约35万元
一套操作系统 大约4万元
一套Oracle数据库 大约25万元
(2)双机热备系统:总计86万元(含1年维护)
两台两路服务器 大约10万元
一套SCSI磁盘阵列 大约8万元
两套操作系统 大约8万元
两套Oracle数据库 大约50万元
一套双机软件 大约5万元
维护费用 大约5万元/年
6、投标指标
(1)可靠性要求达到99.999%,全年平均停机时间5分钟;
(2)全冗余方案设计,故障切换时间小于3秒;
(3)对应用软件透明,支持所有的用户应用软件;
(4)故障切换时客户端不需要重新连接,当前任务不需要重新开始;
(5)便于维护和管理,使用人员不需要专门的维护技术基础。