dataware for unix双机热备的详细配置(1)

第一章

简 介

1.1 Cluster技术

Cluster集群技术可如下定义:一组相互独立的服务器在网络中表现为单一的系统,并以单一系统的模式加以管理。此单一系统为客户工作站提供高可靠性的服务。

Cluster大多数模式下,集群中所有的计算机拥有一个共同的名称,集群内任一系统上运行的服务可被所有的网络客户所使用。Cluster必须可以协调管理各分离的组件的错误和失败,并可透明的向Cluster中加入组件。

一个Cluster包含多台(至少二台)拥有共享数据储存空间的服务器。任何一台服务器运行一个应用时,应用数据被存储在共享的数据空间内。每台服务器的操作系统和应用程序文件存储在其各自的本地储存空间上。

Cluster内各节点服务器通过一内部局域网相互通讯。当一台节点服务器发生故障时,这台服务器上所运行的应用程序将在另一节点服务器上被自动接管。当一个应用服务发生故障时,应用服务将被重新启动或被另一台服务器接管。当以上任一故障发生时,客户将能很快连接到新的应用服务上。

Cluster集群可由N台服务器构成,当我们取Cluster要求的最小值N=2时,就成为一个双机系统。

1.2 DataWare for UNIX系统

现代企业将许多工作从大机系统转向轻便、功能强大、用户友好的PC 服务器和工作站。多服务器组成Cluster执行关键性业务,这些服务器持续监视整个系统状态,保障了系统的高可靠性,为企业提供实时、持续、可靠的数据服务。

目前服务器硬件是广泛有效的,但缺少连接的软件。用户需要一种适应性强、可靠性高、可灵活扩展的综合解决方案。使服务器转向集中维护的集群工作方式。

DataWare for UNIX 是一种用户可配置的软件级解决方案(与容错机系统比较)。DataWare 监控所有的软硬件的资源操作,并且能对多种错误状态做出自动处理。

DataWare 管理两个UNIX 服务器以两种不同的模式(Hot Standby or Dual Active) 运行,当其中一台服务器当机或失效时,另一台服务器接管对等服务器的应用系统,而用户依旧可以存取数据,并不需要知道哪一台服务器在提供服务。

DataWare支持Dual Active工作模式和Hot Standby工作模式。在Hot Standby模式中,一台服务器作为工作机运行业务软件,另一台服务器作为备援服务器始终处于等候主服务器出故障并取而代之的状态;在Dual Active模式中, 两台服务器运行各自业务软件同时监测对方状态, 当其中一台发生故障时, 另一台主机立即将故障服务器的工作接管过来。

1.3 特性

DataWare 是集成的全兼容于UNIX系统的容错软件,用户应用程序和硬件设备无须改动。DataWare能提供两种模式的容错服务,依照系统配置文件(“dw.cfg”)来建立。

当一台服务器当机或失效时, DataWare 自动切换应用到另一台服务器上。这个切换过程可以手工去处理。用户可以执行升级置换或维护服务器的硬件和软件的工作。任意一台服务器的关键操作都可以设置成自动切回。DataWare 在原服务器(生产机)修复后,DataWare 又可切回所有应用给生产机。

1.4 DataWare 的硬件方面

双机系统的硬件包含以下几个部分:

1. 两台基于UNIX 系统的服务器或工作站。每台主机有它专有的操作系统、

应用软件和专有数据。

生产机:为客户端提供应用服务的主机

备份机:当生产机当机或失效时,可接管应用服务的主机

2. 专用网络

专用网络是为两台主机交换操作信息(如心跳信息)而指定的通道。

有两种类型的专用网络

*TCP/IP socket:网卡上绑定TCP/IP 协议,每台服务器不必装有专用的网卡去连接专用网络。(可与公用网络共享同一网卡)

*共享盘:在公共的RAID 系统上建立的5MB 空间。

必须至少建立一种专用网络。

建议:建立多种类型的专用网络防止单点故障。如果当其中一种传输介质或协议失效,这时通过冗余的通道工作。

3. 公用网络

公用网络是网络客户端存取主机资源的通道。

目前DataWare只支持TCP/IP协议。

工作网卡:每台生产机必须安装一块网卡来连接公用网络。这是双机系统接收请求和发送数据的网络接入点。

备份网卡:每台备份机必须安装一块网卡来连接公用网络。当生产机当机或失效时,备份机在接管服务的同时,此网卡将作为双机系统接收请求和发送数据的新的接入点。

4. 公用磁盘

公用磁盘用来存储用户的重要数据,在RAID 磁盘子系统上,每台服务器有它自己的文件系统分区。另外还有5MB 空间作为DataWare 运行时使用的”握手”通信区。例如: /dev/rxxx (SCO UNIX 系统中的裸设备,xxx是裸设备名)。

需要具有双SCSI端口的RAID系统(Power 5XX0系列)。这种磁盘子系统支持在物理磁盘有故障的情况下,仍能在线存取数据。