计算机群集技术概述（一）（转载）

最新推荐文章于 2022-11-03 15:25:08 发布

longminbo

最新推荐文章于 2022-11-03 15:25:08 发布

阅读量1.2k

点赞数

文章标签： web服务负载均衡集群服务器网络工作

本文链接：https://blog.csdn.net/longminbo/article/details/2126972

版权

本文介绍了集群技术的三种主要类别：高可用性集群、高性能计算集群和高可扩展性集群。高可用性集群通过减少服务中断时间，确保关键业务连续运行。高性能计算集群用于提升科学计算能力，例如气象模拟和石油勘探。高可扩展性集群则通过负载均衡策略，如轮询、最小连接数和快速响应优先，确保服务器群的高效运行。文章以Web服务器群集为例，阐述了如何通过负载均衡提高服务性能和应对高并发访问。

摘要由CSDN通过智能技术生成

随着计算机技术以日新月异的速度发展，单台计算机的性能和可靠性越来越好，但还是有许多现实的要求是单台计算机难以达到的。看看下面的例子：

• 某银行需要一台服务器来储存财务数据。他要求这台计算机即使是在机房坍塌的情况下也能够被各个业务网点访问。
• 某科研单位需要用一台超级计算机来模拟气象变化。他们需要有相当于200GHz奔腾4处理器的浮点运算能力。
• 某网络公司刚刚起步。他们想要一台现在5万人民币以下，但以后可以逐步升级到具有巨型计算机能力的服务器来运行数据库。

在这些情况下，往往需要将多台计算机组织起来进行协同工作来模拟一台功能更强大解决问题。这种技术称为集群技术。目前应用最为广泛的集群计算技术可以分为三大类：高可用性集群技术、高性能计算集群技术和高可扩展性集群技术。下面我们将对这三种集群技术进行一下简单的介绍。

高可用性集群技术
高可用性集群，英文原文为High Availability Cluster, 简称HA Cluster，是指以减少服务中断（宕机）时间为目的的服务器集群技术。

随着全球经济的增长，世界各地各种各样的组织对IT系统的依赖都在不断增加，电子贸易使得商务一周七天24小时不间断的进行成为了可能。新的强大的应用程序使得商业和社会机构对日常操作的计算机化要求达到了空前的程度，趋势非常明显，我们无时无刻不依赖于稳定的计算机系统。

这种需求极速的增长，使得对系统可用性的要求变得非常重要，许多公司和组织的业务在很大程度上都依赖于计算机系统，任何的宕机都会造成严重的损失，关键IT系统的故障可能很快造成整个商业运作的瘫痪，每一分钟的宕机都意味着收入、生产和利润的损失，甚至于市场地位的削弱。

Industry Business Operation                    Average Cost per Hour of Downtime
Financial Brokerage operations                    $6.5 million
Financial Credit card/sales authorization $2.6 million
Media Pay-per-view television                    $1.1 million
Retail Home Shopping (TV)                    $113.0 thousand
Retail Home catalog sales                    $90.0 thousand
Transportation Airline reservation $89.5 thousand

根据1998年Garter Group的统计我们可以看出，我们需要可以不间断使用的计算机系统，并且这种对高可用性系统和技术的需求还会不断的增长。

可用性是指一个系统保持在线并且可供访问，有很多因素会造成系统宕机，包括为了维护而有计划的宕机以及意外故障等，高可用性方案的目标就是使宕机时间以及故障恢复时间最小化，可以容忍的宕机时间明确的说明方案的全面性、复杂性和成本

Percent Available downtime/Year Classification
99. 5                    3.7 days                   Conventional
99. 9                    8.8 hours                  Available
99. 99                        52.6 minutes     Highly Available
99. 999                      5.3 minutes         Fault Resilient
99. 9999                    32 seconds         Fault Tolerant

为了提高整个系统的可用性，除了提高计算机各个部件的可靠性以外，一般情况下都会采用集群的方案。
所谓集群，就是共同为客户机提供网络资源的一组计算机系统。而其中的每一台提供服务的计算机，我们称之为节点。当一个节点不可用或者不能处理客户的请求时，该请求将会转到另外的可用节点来处理，而这些对于客户端来说，它根本不必关心这些要使用的资源的具体位置，集群系统会自动完成。
集群中节点可以以不同的方式来运行，这要看它们是如何设置的。在一个理想的两个节点的集群中，两个服务器都同时处于活动状态，也就是在两个节点上同时运行应用程序，当一个节点出现故障时，运行在出故障的节点上的应用程序就会转移到另外的没有出现故障的服务器上，这样一来，由于两个节点的工作现在由一个服务器来承担，自然会影响服务器的性能。
针对这种情况的解决方案是，在正常操作时，另一个节点处于备用状态，只有当活动的节点出现故障时该备用节点才会接管工作，但这并不是一个很经济的方案，因为你不得不买两个服务器来做一个服务器的工作。虽然当出现故障时不会对性能产生任何影响，但是在正常运行时的性能价格比并不太好。
从上面的工作方式出发，我们可以把集群分为下面几种（特别是两节点的集群）

主/主 (Active/active)

这是最常用的集群模型，它提供了高可用性，并且在只有一个节点在线时提供可以接受的性能，该模型允许最大程度的利用硬件资源。每个节点都通过网络对客户机提供资源，每个节点的容量被定义好，使得性能达到最优，并且每个节点都可以在故障转移时临时接管另一个节点的工作。所有的服务在故障转移后仍保持可用，但是性能通常都会下降。
主/从(Active/passive)

为了提供最大的可用性，以及对性能最小的影响， Active/passive模型需要一个在正常工作时处于备用状态，主节点处理客户机的请求，而备用节点处于空闲状态，当主节点出现故障时，备用节点会接管主节点的工作，继续为客户机提供服务，并且不会有任何性能上影响。
混合型(Hybrid)

混合是上面两种模型的结合，只针对关键应用进行故障转移&#