最近,因为在为客户讲述使用数据库集群的相关内容,研究市面上的有关技术和产品,以及MSSQL 自带的技术,接下来几篇就为大家说说之前研究的一些结果,同时也发布一些整理的资料。
不少公司推出了针对数据库的“集群”解决方案,下面我们就简要的介绍一下他们的一些实现的原理。
基于串行复制技术
串行复制技术,本来是用于数据复制和数据备份的,离人们熟悉的“数据库集群”的概念有一定的距离。但是由于计算机软硬件技术和网络通讯技术的快速发展,使得利用这种概念和技术构成的“数据库集群”有了一定的可行性。此类集群,又可以分两类:
1.串行异步复
此种方式是异步串行复制或日志拷贝(Log Shipping)。主数据库完成事务处理后,生成事务处理日志,日志记录通过FIFO 队列,进入备份数据库处理,从而得到备份数据。此种方式的缺陷在于:
a. 复制队列溢出问题:主数据库是并行处理而日志拷贝是串行的,因此备份数据库处理日志记录也是串行的。因此,FIFO 队列的溢出随时可能发生。一旦发生,队列必须重建,从而需要重新建立备份数据库。此种方法对于一般客户来讲是不可行的。
b. 或者为了避免队列溢出,必须保证主数据库处理事务的速度小于备份数据库,这样将严重束缚主数据库的性能发挥。
c. 由于日志拷贝是异步的,主备数据库不是实时一致。因此无法用备份数据库作负荷均衡。
d. 由于主备数据库永远不一致, 主数据库一旦发生事故,就一定会丢失数据。在这种情况下,要么需要手工恢复数据库,这会消耗大量的人工成本,或者数据根本就不能恢复。
2.串行同步复制
此类集群往往是由昂贵的专用软硬件构成的,原理图如下:
此类系统采用专用的高速网络和软件技术,将每个数据库的请求,通过同步复制的方式,同步在主备两台数据库服务器上执行正确后,才将结果返回给数据库客户。
此系统的特点是:
a. 主数据库被强迫与备份数据库同步串行处理,因此性能受到限制。
b. 主备数据库中任意一个出现问题,都会迫使事务处理交易回滚,因此整个系统的可靠性比单机系统降低了一半。
c. 由于以上问题,这种备份方式只适用于近距离光纤网络(5 英里)。
d. 专用系统造价昂贵,又加上述明显缺陷,因此市场上很少被采用。
基于双机容错技术
从技术适应性的角度讲,双机容错比较适合于无状态应用,或者状态信息较少的应用切换,以此达到应用级的高可用性目的,其实并不适合于数据库级的应用切换。
此种结构往往是两个服务器共享一个磁盘阵列,这里两个服务器共享一个虚拟的IP 供数据库客户使用,形成一个单一的逻辑数据库映象。
此种所谓的数据库集群的目的是,一旦主机系统出现问题,备份系统通过心跳机制的检测,完成从主机系统到备份系统的切换,它有下列特点:
a. 此种高可用性解决方案只是无状态系统(典型的如Web 服务器)的普通容错切换思想在数据库领域的应用。
b. 此系统本身只有一个单一的数据映象,数据储存在共享的磁盘阵例上,因此共享的磁盘阵例成为了整个系统的单点错误源。
c. 由于是单一数据映象,因此必须采用通常的复制或备份方法获取第二份数据,以保证数据的安全性。因此所有复制或备份方法的缺点,此类系统全部存在。
d. 主机系统和备份系统之间是没有任何负载均衡关系的,在正常情况下,备份系统是闲置在那里,因此对用户来说是一种投资浪费。
e. 在错误切换的时候,往往存在切换时间长,而且更严重的是存在丢失用户交易数据丢失的现象,结果导致系统被迫停止服务,或者需要人工修复数据,或者数据永远找不回来。
f. 在错误切换的时候,有时候会发生备份系统的数据库启动不了的情况,这时候,整个数据库系统也就无法访问了,这与双机方案本身是高可用性方案的宗旨是相抵触的。
RAC 的英文全称是:Real Application Cluster(真正的应用级集群)。我们需要关注的是“应用级”。为了缓解数据库系统日益增长的性能压力,ORACLE 公司推出了RAC系统。它基本结构如下:
此类系统,专门是针对数据库性能问题而提出的。采用共享磁盘阵列的方式,因此在结构上和上述双机容错相似,不同的地方在于此系统中的数据库节点之间采用的不是简单的心跳检测,而是ORACLE 公司自己定义的一套复杂的信息交换协议,以此来动态分配来自数据库客户端的请求。它的特点是:
a. 是个应用级的集群,也就是针对ORACLE 的数据库管理系统(因为数据库管理系统对于操作系统来讲,就是一个“应用程序”,因此被称为“应用级集群”),专门为提高数据库性能而设计。
b. 此系统本身只有一个单一的数据映象,数据储存在共享的磁盘阵例上,因此享的磁盘阵例成为了整个系统的单点错误源。
c. 管理配置复杂。
d. 由于是单一数据映象,因此必须采用通常的复制或备份方法获取第二份数据,以保证数据的安全性。因此所有复制或备份方法的缺点,此类系统全部存在。
e. 由于数据库系统本身具有高I/O 的特性,因此,RAC 系统里,磁盘I/O 是提高性能的关键地方。
综合上所述,针对数据库系统普遍存在的三大方面的问题,上述各个技术和方案,各有不同的侧重,实现的代价和复杂度也各不相同,但是它们有共同的特点是:只解决数据库系统的某一方面的问题,甚至在解决这方面问题的时候,同时加重了另外一个或两个方面的问题。
Oracle RAC vs SQL Server 第一篇: Oracle RAC 篇利弊分析
Oracle RAC vs SQL Server 第二篇:RAC管理的复杂性
Oracle RAC vs SQL Server 第三篇: SQL Server横向扩展方案-SODA
Oracle RAC vs SQL Server 第四篇: SQL Server横向扩展方案-P2P
Oracle RAC vs SQL Server 第五篇: SQL Server横向扩展方案-可伸缩的共享数据库
Oracle RAC vs SQL Server 第六篇: Data Dependent Routing