摘要
随着计算机技术和网络技术的迅猛发展,高性能计算机集群系统的应用也变得越来越普及。该文首先讨论了校园网中基于Linux环境的集群服务系统,随后以曙光TC4000集群系统为实例重点说明校园网中集群系统的管理、分布以及在校园网中
结点的高性能应用。
关键字
集群,高性能,集群服务系统
0
引
言
广义来说,集群就是相互独立的一些系统的集会。它们利用高速通信网络将这些系统按某种结构进行高速互联,这样所构成的一个计算机组叫集群
[1]。构成集群的目的是为了提高系统的整体性能、系统的可用性和规模的可扩展性。在集群系统中,每台服务器都承担相应的子任务,因而服务器的个数将与工作效率呈正比例增长。对程序员和用户来说,集群系统就是一个整体的并行系统
[2]。
随着技术的进步和需求的增加,往往会出现大规模的科学计算和商业数据处理,如以数据资源为中心的数据库管理系统将面对着越来越复杂的数据处理类型。为了提高信息处理的效率,许多大学都开始引入和使用高可靠性、高性能的集群系统。本文将详细讨论基于校园网的集群分布以及集群系统在校园网中的应用与管理,并以曙光TC4000的集群系统为实例,说明集群技术在校园网中高性能应用的实现框架。
1
基于
Linux
平台的集群系统
九十年代末期,Linux操作系统不断走向成熟。它的健壮性不断增强,并且提供了GNU软件和标准化的PVM、MPI消息传递机制。最重要的是Linux在普通PC机上提供了对高性能网络的支持,这样就大大推动了基于Linux的集群系统的发展
[2]。
按照侧重点的不同, 可以把Linux 集群分为三类:科学集群、负载均衡集群和高可用性集群。科学集群通常涉及为集群开发并行编程的应用程序, 以解决复杂的科学问题, 这是并行计算的基础。它不采用并行超级计算机体系结构,而是通过高速通信链路来连接多台独立的计算机系统,并在公共消息传递层上进行通信以运行并行应用程序。随着计算机技术与通信技术的迅猛发展,其处理能力能够与超级计算机相媲美。
负载均衡集群目的是提供和节点个数成正比的负载能力, 常用于提供大访问量的Web服务,以及企业的管理信息系统。该系统能够将整个系统的运行负载分摊到不同的节点上, 以减轻传统单节点